Inteligencia artificial
ENTREVISTAS
Analítica de datos
IA generativa

"El concepto de nube privada sigue muy implantado y no creo que vaya a desaparecer nunca"

Juan Carlos Sánchez de la Fuente, vicepresidente regional para España y Portugal de Cloudera, analiza el estado de madurez de las compañías para llegar a ser verdaderamente data driven.

Juan Carlos Sánchez, Cloudera
Play

Audio de la entrevista

 

Mario Moreno/ Imagen: Juan Márquez

Cloudera es una compañía especializada en la gestión y extracción del valor del dato en entornos híbridos. Hablamos con Juan Carlos Sánchez de la Fuente, su vicepresidente regional para España y Portugal, en un momento en el que el volumen global de datos se incrementa a pasos agigantados -llegará a 180 zetabytes en 2025 según sus estudios internos- y que confluye con el auge de tecnologías que están empezando a ser clave para la eficiencia de las organizaciones como la nube o la inteligencia artificial (IA) generativa, de la que, dice, está cambiando el tablero de juego. 

 

¿Cuáles son los principales retos de las compañías españolas para convertirse en data driven?

El principal es el crecimiento masivo de la recepción, uso y aporte de valor de los datos. En este auge estamos viendo mucho dato no estructurado, que viene de la cantidad de fuentes de diferentes tipos que crean, por ejemplo, mucho dato a través de imágenes, vídeos y contenidos que antes no eran sencillos de almacenar, y mucho menos de analizar. La clave para que las organizaciones tengan un enfoque data driven es que el dato las ayude a ser mucho más eficientes, competitivos y a diferenciarse en los mercados en los que trabajan. Nosotros aportamos soluciones que las ayudan a aglutinar la información y a sacar valor desde la fase de ingestión y captura de datos, pasando por todo ese ciclo de vida en el que somos capaces de hacer la ingeniería y analítica del dato y de toda esa explosión relacionada con la inteligencia artificial (IA), en la que creamos modelos mucho más eficientes para que las compañías obtengan ese valor.

 

A día de hoy, ¿cuál es el nivel de madurez de la empresa local en cuanto a todo este proceso?

Somos un país vanguardista, pero, al mismo tiempo, aún queda mucho por hacer. Cuando digo vanguardista es porque tanto en las empresas privadas como públicas hay una apuesta clara por la transformación digital. En los modelos privados se ven muchas iniciativas en torno al dato. Sin embargo, cuando profundizas en la realidad de su uso ves que el porcentaje es bastante bajo en cuanto a compañías que en su pura definición ya sean data driven. Se encuentran en el camino de hacer una evolución completa. Es como la adopción de la nube; vamos avanzados a la hora de poder adaptar los proyectos a cloud, pero todavía estamos en un punto actual de digitalización. Las organizaciones públicas también se encuentran en un momento clave en el que a través de los fondos europeos ha habido muchos movimientos. En los próximos dos años vamos a ver proyectos realmente transformadores tanto en estrategias en tiempo real basadas en la información como en todo lo que tiene que ver con el machine learning (ML) y la IA.

 

Ya que menciona la nube, ¿el modelo de facto es multicloud? ¿Cuál es la estrategia de Cloudera en este sentido?

En el mercado vemos una tendencia hacia proyectos 100% nube. Pero la capacidad que tenemos de elegir diferentes espacios hace que los entornos multicloud sean la primera elección. Pero no nos quedamos ahí, el concepto de nube privada sigue estando todavía muy implantado y no creemos que vaya a desaparecer nunca. Va a haber un crecimiento exponencial de proyectos en la nube pública, pero la privada no va a caer. Con esto quiero decir que es muy importante aportar flexibilidad y soluciones para que las empresas no creen silos entre ellas y puedan interactuar en diferentes nubes.

 

 

"El dato debe ayudar a las empresas a ser mucho más eficientes, competitivas y a diferenciarse en sus mercados"

 

 

De hecho, según varios analistas, la adopción de nube pública en Europa no supera cotas del 20% y la mayoría de las herramientas utilizadas en este ámbito son de videoconferencia y correo electrónico. Es decir, los datos core de las compañías se mantienen onpremise.

Es cierto que venimos de una infraestructura más tradicional. En un estudio interno comprobamos que cerca del 70% de los proyectos que se están creando son 100% en la nube. Nosotros aportamos una solución híbrida, y el mensaje es diferencial, porque no hay ningún otro fabricante que sea capaz de tener un entorno híbrido multinube con el mismo run time desde el punto de vista de ejecución de procesos, de que las cargas de trabajo se puedan ejecutar indistintamente en cada uno de los espacios y de que podamos tener proyectos que sean multinube y multinfraestructura. De lo único que se tienen que preocupar las empresas es de sacar valor a los datos para dárselo al negocio.

 

Un estudio de mercado afirma de Cloudera que gestionar 25 millones de terabytes de todos sus clientes sitúa a la compañía a la misma altura que los hiperescalares.

Cloudera es una firma relativamente joven (nace en 2008) pero con un grado de madurez muy alto que maneja muchísima información. Esa cantidad de datos nos aporta experiencia para que nuestro roadmap de evolución del producto esté totalmente alineado con las expectativas del mercado y las demandas del cliente. Nuestra experiencia hace que sepamos adaptar las necesidades y ofrecer las soluciones que se demandan. Es un histórico que mantenemos y crecemos, sobre todo en nube y multicloud.

 

En el mes de junio la compañía lanzó su propio chatbot basado en modelos de lenguaje grande (LLM, de sus siglas inglesas). Más allá de este proyecto concreto, ¿cómo está afectando al sector la IA generativa?

Dentro de nuestro porfolio, hablamos de proyectos de ML enfocados a los equipos de ciencia de datos desde hace bastante tiempo. Pero no solamente nosotros, sino todos los fabricantes del mundo del dato. Sin embargo, en este 2023 ocurre la explosión de ChatGPT, que ha cambiado el mercado y la percepción de lo que la IA puede aportar. Estamos en ese punto añadido de ‘lo generativo’, que a través de la información y esos modelos de datos es capaz de crear respuestas nuevas en cuanto a la información que tiene. ChatGPT ha llegado a la sorprendente cifra de 100 millones de usuarios en apenas dos meses. Si comparamos el histórico, Youtube o Facebook tardaron más de cuatro años en lograrlo. Ahora, el problema es que da muchas respuestas que no están contextualizadas. Y, esto, junto a la seguridad de la información, es lo que hace que se cree un entorno corporativo de alta preocupación. Todos los empleados de todas las empresas en todas las geografías se han puesto a probarlo. Y estas han tenido que poner controles para que no hubiera un uso masivo de ChatGPT y pudieran trabajar en esas iniciativas. Cloudera ve el problema en la seguridad del dato y en la veracidad de la información; en ese concepto de no contextualización, de que sea un ‘dato analfabeto’. Nosotros tenemos un subconjunto de soluciones (AMP) para que las empresas puedan realizar sus LLM. Hemos creado un LLM totalmente contextualizado, y el cliente tiene un modelo en la nube para entrenarlo con sus datos. En los pilotos e iniciativas con clientes estamos viendo que son capaces de crear su propio ChatGPT en un espacio de tiempo muy reducido y con unas respuestas realmente sorprendentes. Cloudera se ha movido muy rápidamente para poder dar una solución sencilla, rápida, versátil y que realmente responda a las necesidades de las compañías.

 

 

"ChatGPT ha cambiado el mercado y la percepción de lo que la IA puede aportar"

 

 

¿Cómo asume la compañía toda la legislación europea en torno a la residencia del dato y a la IA?

Nosotros nos adaptamos a todas las legislaciones. Pero desde un punto de vista de auditoría, la clave está en que el dato nunca pertenece a Cloudera. Si hablamos de onpremise, la información va a estar alojada en el centro de datos del cliente. Si lo hacemos de nube, trabajamos siempre con terceros. No somos una solución de software como servicio (SaaS), sino de plataforma como servicio (PaaS), por lo que el dato nunca es nuestro. No va a haber nunca ese riesgo asociado a la propiedad intelectual. Lo que sí hacemos es trabajar estrechamente con los principales hiperescalares para ir a su ritmo en cuanto a la liberalización de los diferentes espacios. Por ejemplo, AWS ha sido el último en contar con una región cloud en España y nosotros hemos pasado todos los controles pertinentes para que ese espacio esté disponible para los servicios de Cloudera.

 

Otra de las claves de Cloudera es el código abierto. En 2018 compra Hortonworks afianzando su apuesta por este ámbito.

La importancia de open source es total. Es uno de los pilares de la compañía. No es que cuando comprara Hortonworks atrajera ese concepto, sino que desde su nacimiento ha estado muy orientada a él. El objetivo de la fusión es tener una solución mucho más competitiva para ofrecer lo mejor de ambas compañías. De ahí sale el nacimiento de lo que nosotros llamamos Cloudera Data Platform. En cuanto a código abierto, somos la empresa número uno a la hora de colaborar con esta comunidad para ayudar a la evolución de los proyectos. Luego hacemos una adopción de estos, como por ejemplo, el proyecto Iceberg, que es un marco de trabajo que ha venido a ayudar a la gestión del dato masivo grande. Archivos de gran tamaño que no se pueden gestionar fácilmente. La diferencia de Cloudera de otras compañías es que según hay un salto de versión en proyectos importantes a nivel tecnológico, como Spark, la adoptamos rápidamente dentro de nuestra plataforma.

 

¿La tecnología de Cloudera necesita que la empresa que la compra cuente con un CDO (Chief Data Officer)?

No. Nosotros muchas veces posicionamos la tecnología frente a la división de datos, otras frente a la de negocio, y otras ante la de tecnología, dependiendo de los tipos de proyectos. Luego, cada organización tiene diferentes estructuras. A veces nos encontramos con espacios donde los grupos de ciencia de datos no dependen de la oficina del CDO. O que iniciativas que son puramente tecnológicas ,como una arquitectura para crear un repositorio de datos, están siendo lideradas por el CIO. La clave no es tanto el interlocutor como entender el valor de las estrategias que se ofrecen. Entender al negocio y a sus necesidades.

 

Son muchos los perfiles tecnológicos que han salido en la conversación y que necesitan las empresas. Al respecto, ¿Cloudera cuenta con algún tipo de iniciativa para el desarrollo y la atracción de talento?

Al estar muy vinculados a las tecnologías ‘open’, apoyamos mucho la gestión del talento generalista. No de tecnologías que sean propietarias. Tenemos carreras de formación con un plan definido. En este 2023 hemos hecho una apuesta clara por la formación gratuita, con más de 30 cursos. A nivel estatal tenemos acuerdos con Fundae y con el SEPE para que todo ciudadano tenga acceso. También con diferentes comunidades y consejerías de educación para la formación y la certificación. El talento es clave, muchos proyectos de muchas organizaciones no salen adelante porque escasea.

 

¿Cuáles son las expectativas de Cloudera en el mercado local durante este año?

Yo me incorporo a Cloudera hace tres años y medio, con lo cual este es mi cuarto ejercicio. Y han sido todos de crecimiento a doble dígito. En el primer trimestre de este año también, y vemos muchísimo movimiento en el mercado. Es cierto que estamos en un momento de contención. Tanto el cierre del ejercicio natural como el inicio han sido complejos para las empresas tecnológicas en general, con despidos y reestructuraciones. Sin embargo, sigue habiendo iniciativas porque se sigue demandando diferenciación, por ejemplo en temas de IA generativa. Muchas empresas, también del IBEX35, no tenían presupuestos destinados a proyectos de este calado, y ahora sí. Existe la posibilidad de que siga habiendo movimiento y negocio, y nuestra expectativa es que va a ser un año de crecimiento.

 

¿También en el ámbito de negocio con las administraciones públicas, donde ha habido un parón de actividad debido a las elecciones?

Como defensor de la empresa y del tejido local, me preocupa la situación. La peor solución es que haya bloqueo en cuanto a la toma de decisiones. Es verdad que a nivel nacional tenemos compromisos definidos con Europa respecto a la inversión y el gasto de los Fondos Next Generation. Independientemente de que tardemos menos o más en formar gobierno, tenemos que conseguir que se muevan las iniciativas y compromisos dados. Obviamente creo que sí que va a haber un impacto, pero no dramático. Es un año clave para todas las empresas y para el ciudadano final.

 



Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital