Big Data

Snowflake adopta una estrategia de código abierto para captar la atención del catálogo de datos

Con su plan para hacer que su catálogo de datos Polaris sea de código abierto, Snowflake espera que la nueva oferta sea vista como neutral para los proveedores

snowflake sede

Snowflake abrirá el código fuente de su nueva estrategia Polaris, sugiriendo que pretende alejar a los usuarios del catálogo Unity de su rival Databricks y, al mismo tiempo, reforzar el atractivo de su propia oferta, según diversos analistas de mercado. “La decisión de lanzar Polaris Catalog proporciona una respuesta competitiva, mejorando así su propuesta de valor y fomentando una comunidad vibrante en torno a su nuevo catálogo de datos”, dice Jayesh Chaurasia, analista de investigación y asesoría de Forrester.

El Unity Catalog de Databricks, que estuvo disponible de forma general en junio de 2022 y luego se actualizó con las capacidades de Okera el año siguiente, es una oferta de gobernanza unificada de código cerrado que proporciona capacidades centralizadas de control de acceso, auditoría, linaje y descubrimiento de datos en todos los espacios de trabajo de Databricks.

Polaris, lanzado durante la conferencia anual de Snowflake esta semana, ofrece capacidades similares a Unity Catalog, pero está construido sobre el popular formato de tabla de datos de código abierto Apache Iceberg. "Con Polaris Catalog, los usuarios ahora obtienen un lugar único y centralizado para que cualquier motor encuentre y acceda a las tablas Iceberg de una organización con seguridad consistente e interoperabilidad completa y abierta", dijo Snowflake en un comunicado, agregando que Polaris Catalog se basa en el código abierto REST de Iceberg. protocolo, que proporciona un estándar abierto para que los usuarios accedan y recuperen datos de cualquier motor que admita Iceberg Rest API, incluidos Apache Flink, Apache Spark, Dremio, Python y Trino, entre otros.

La complejidad y diversidad de los sistemas de datos, junto con el deseo universal de las organizaciones de aprovechar la IA, requiere el uso de un catálogo de datos interoperable, que probablemente sea de código abierto por naturaleza, según Chaurasia. “Un catálogo de datos de código abierto aborda la interoperabilidad y otras necesidades, como la escalabilidad, especialmente si se construye sobre un formato de tabla popular como Iceberg. Este enfoque facilita la gestión de datos en varias plataformas y entornos de nube”, dijo Chaurasia.

Por otra parte, el vicepresidente de investigación de la firma de investigación de mercado IDC, Stewart Bond, señaló que Polaris Catalog puede haber aprovechado los Iceberg Catalogs nativos de Apache Iceberg y haberle agregado capacidades de nivel empresarial, como administrar múltiples instancias distribuidas de repositorios Iceberg, proporcionar linaje de datos y capacidad de búsqueda para utilidades de datos y capacidades de descripción de datos, entre otros.

Polaris Catalog, que Snowflake espera abrir en código abierto en los próximos 90 días, puede alojarse en su AI Data Cloud patentada o autohospedarse en la propia infraestructura de una empresa utilizando contenedores como Docker o Kubernetes.

 "Dado que la implementación de backend de Polaris Catalog será de código abierto, las organizaciones pueden intercambiar libremente la infraestructura de alojamiento mientras conservan todos los controles de seguridad y eliminan la dependencia del proveedor", dijo la compañía, y agregó que Polaris Catalog dentro de AI Data Cloud de Snowflake se encuentra actualmente en versión preliminar pública.

 

¿Es Polaris Snowflake la baza para ganarse la buena voluntad de la comunidad?

Mientras que expertos como Chaurasia de Forrester y Tony Baer de dbInsight creen que Polaris Catalog es una estrategia ampliada para que la empresa amplíe su alcance y adquiera nuevos clientes, el vicepresidente de investigación de The Futurum Group, Steven Dickens, cree que es un intento "desesperado" de obtener "buena voluntad". ”de los clientes y la comunidad de código abierto.

El catálogo de datos de código abierto que pronto será abierto, según Dickens, es una consecuencia directa de las deficiencias y limitaciones de Snowflake, incluida la mala interoperabilidad, la dependencia de los proveedores, los costos exorbitantes, la falta de innovación y la dependencia de las asociaciones.

“Snowflake es notoriamente caro y su estructura de costos ha llevado a muchos clientes a buscar alternativas. Polaris puede verse como un último esfuerzo para retener a los clientes al ofrecer una alternativa de código abierto potencialmente más barata”, dijo Dickens.

Además, Dickens ve el paso de Snowflake al Polaris Catalog de código abierto como una forma de contrarrestar su “ritmo de desarrollo más lento e insular”.

"Polaris es un intento de aprovechar la innovación externa para compensar el estancamiento interno de Snowflake", explicó Dickens.

 



Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital