Cloud Computing

Cloudera Enterprise se actualiza para proporcionar mejor rendimiento y eficiencia operacional

Con la versión 5.7 Cloudera Enterprise mejora el procesamiento de datos con soporte Hive-on-Spark y proporciona visibilidad en el uso de múltiples usuarios

Hadoop

Con la versión actualizada de Cloudera Enterprise, la 5.7, se ofrece una mejora del rendimiento  través de cargas de trabajo, incluyendo, según datos de la compañía, un promedio de mejora 3x en el procesamiento de datos, con soporte adicional de Hive-on-Spark, y una mejora de promedio 2x del análisis de inteligencia de negocio con actualizaciones de Apache Impala. Además, esta versión añade visibilidad en el uso de múltiples usuarios a través de estas cargas de trabajo para la eficiencia de la gestión y la dotación óptima de recursos.  

En concreto Cloudera 5.7 incluye como características adicionales una mejora de 2x de rendimiento para analíticas BI: Impala continúa manteniendo su ventaja de rendimiento como el motor de análisis SQL más rápido para Hadoop a través de dynamic partition pruning, inicio de consulta más rápido, filtros en el tiempo de ejecución y más; ruta de producción simplificada: Cloudera Manager incluye plantillas agrupadas que proporcionan un flujo de trabajo simple para reproducir fácilmente ajustes de configuración de nuevos grupos, por lo que es fácil pasar de un entorno de prueba bien afinado a la producción, escalabilidad en todas las regiones o revierten rápidamente a una configuración válida cuando se producen problemas; y optimización de la gobernanza de datos: Cloudera Navigator abre la gestión de datos y la gobernanza para el usuario de negocio con el linaje simplificado para establecer la confianza y la procedencia de los datos y añade metadatos administrados para mejorar la visibilidad y la coherencia entre sistemas.

Apuesta por Hadoop

Cloudera Enterprise 5.7 supone un nuevo paso en el desarrollo de Hadoop a medida que esta plataforma se adapta a nuevas funciones y usos  nuevos y cambiantes. Con la actualización también se pone de manifiesto el compromiso de Cloudera para asegurar que las organizaciones actuales pueden incorporar la plataforma Hadoop a sus nuevas necesidades y prácticas empresariales. “Hadoop ha evolucionado significativamente en los últimos diez años y, con cada avance, hemos visto el potencial para nuevas aplicaciones y casos de uso, mientras sigue mejorando lo que ya se estaba haciendo”, afirma Charles Zedlewski, vicepresidente de productos en Cloudera. “El avance de la ingeniería de datos y el desarrollo de ETL con Hive-on-Spark marca un hito fundamental en esta evolución, y sirve para consolidar a Spark como el motor de procesamiento de datos estándar de Hadoop. La ingeniería de datos es solo una parte de la historia en los negocios de hoy, ya que con la versión 5.7 nuestros clientes pueden permitir una amplia variedad de clientes en nuestra plataforma, todo ello manteniendo rendimiento rápido, facilidad de gestión y cumplimiento con la seguridad”.

El desarrollo de ETL y el procesamiento por lotes de datos es uno de los usos más comunes de Hadoop. Apache Hive ha jugado un papel clave para gestionar estas cargas de trabajo, aunque tradicionalmente se ha aprovechado MapReduce como el motor de ejecución subyacente. Sin embargo, un desarrollo más sencillo y un rendimiento más rápido, si se le compara con MapReduce, permite que Apache Spark esté jugando un papel cada vez más importante y que esté preparado para remplazar a MapReduce a la hora de gestionar estas cargas de trabajo.

Gran ecosistema

En este sentido, el año pasado Cloudera lanzó One Platform Initiative como hoja de ruta para completar la transición de MapReduce a Spark y están llevando el desarrollo para la integración de Spark con Hadoop sea mejor –garantizando que cumple los requisitos de la empresa, incluso para las grandes cargas de trabajo. Con el lanzamiento de Hive-on-Spark en Cloudera 5.7, se da un paso más para acercarse a desarrolladores que ahora pueden aprovechar las potentes capacidades de procesamiento de datos de Spark, sin dejar de utilizar Hive y con una mejora 3x en el rendimiento. Hive-on-Spark es una iniciativa puesta en marcha de forma conjunta por Cloudera, IBM, Intel, MapR, entre otros, y en la que participan los clientes de una amplia variedad de industrias, incluyendo publicidad, servicios financieros y seguros, como parte de un programado de acceso temprano para un mayor desarrollo. Para mayor coherencia, Cloudera ha trabajado con su ecosistema de más de 2.300 socios para asegurar que sus clientes puedan seguir usando las principales herramientas de integración y preparación de datos con Hive-on-Spark, sin alterar la actividad comercial. Socios tales como: ClearStory Data, Elastic, NGDATA, Solix, Trillium Software, Zementis, y otros que están trabajando con Cloudera para certificar sus tecnologías para una transición sin problemas.



TE PUEDE INTERESAR...

Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital