Disco es una implementación de mapreduce para computación distribuida. Disco admite cálculos paralelos sobre grandes conjuntos de datos, almacenados en un grupo de computadoras no confiable, como en el marco original creado por Google. Esto lo convierte en una herramienta perfecta para analizar y procesar grandes conjuntos de datos, sin tener que preocuparse por tecnicismos difíciles relacionados con la distribución, como los protocolos de comunicación, el equilibrio de carga, el bloqueo, la programación de tareas y la tolerancia a fallas, que son manejados por Disco. P >
Disco MapReduce Comentarios
Todavía no hay comentarios