Gemini, de Google, avanza hasta una IA generativa multimodelo

Es capaz de ingerir y proporcionar contenido basado en texto, audio, imágenes y vídeo.

También te puede interesar:

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa
Google fija cambios clave en Europa antes de que entren en vigor nuevas medidas regulatorias

Lucas Mearian
12 FEB 2024

Google ha anunciado la reconstrucción y cambio de nombre de su chatbot Bard, ahora Gemini, para dotar a las empresas y usuarios de plataformas de inteligencia artificial (IA) generativa multimodelo. Este lanzamiento representa un desafío directo a Copilot de Microsoft, basado en ChatGPT de OpenAI, y a todos los demás servicios basados en modelos grandes de lenguaje (LLM, de sus siglas inglesas).

“Gemini es actualmente el único modelo nativo de IA generativa multimodelo disponible”, según, Chirag Dekate, analista vicepresidente de Gartner. “Google ya no está tratando de ponerse al día. Ahora es al revés”. Dekate ha calificado a Gemini como “un gran problema” porque con un modelo multimodal, un solo motor de IA generativa realiza tareas individuales con mayor precisión porque está aprendiendo de un cuerpo de conocimiento mucho más grande. Básicamente, catapulta a Google a la cabeza del paquete de IA generativa.

La compañía presentó por primera vez su modelo Gemini AI en diciembre, anunciando capacidades que le permiten combinar diferentes tipos de información, entradas y salidas, incluidos texto, código, audio, imágenes y vídeo.

A diferencia de los motores exclusivos de LLM, como GPT, Llama 2 de Meta o incluso el propio PaLM2 de Google, Gemini no se basa en la misma tecnología. En su lugar, se puede entrenar utilizando todo tipo de medios y contenidos. Esto es importante porque una empresa ahora puede crear un chatbot que ya no se limita a cargar respuestas a consultas a partir del texto en el que se ha entrenado su LLM.

“Cuando veo una película, estoy viendo el vídeo, leyendo el texto (subtítulos), escuchando el audio, y todo está sucediendo simultáneamente creando una experiencia hiperinmersiva”, asegura Dekate. “Esto, en pocas palabras, es multimodalidad. Compárese con experimentar una película leyendo solo su guion (LLM); esta es la diferencia entre LLM y multimodalidad”.

El año pasado, afirma Dekate, fue de ideación, ya que las empresas y los consumidores aprendieron sobre la IA generativa y los chatbots a raíz del lanzamiento de ChatGPT. Ahora, las empresas comprenden mejor las posibilidades de la IA generativa y están abriendo sus inversiones para implementar sistemas de back-end y front-end con ella.

Si usted pertenece a una empresa de atención médica, por ejemplo, que intenta diseñar un chatbot más inmersivo para médicos, un motor de inteligencia artificial multimodal puede ingerir fragmentos de audio, imágenes radiológicas y escaneos de vídeo de resonancia magnética de un médico para crear pronósticos y resultados de tratamiento mucho más precisos.

"Esto crea una experiencia personal e hiperinmersiva. Nada de esto es posible con una simple experiencia de LLM", dijo Dekate. "Si Google puede permitir que las empresas y los consumidores experimenten esta experiencia multimodal, entonces Google tiene la oportunidad de cambiar la cuota de mercado".

En 2024, se espera que el gasto en soluciones en IA generativa alcance los 40.000 millones de dólares, frente a los 19.400 millones de dólares de 2023. Para 2027, se espera que el gasto en genAI alcance los 143.000 millones de dólares, con una tasa de crecimiento anual compuesta de cinco años del 73,3%, según la firma de investigación IDC.

"Lo que vimos el año pasado fue la aparición de modelos específicos para cada tarea: texto a texto, texto a imagen, texto a vídeo, imagen a ext, etc.", dijo Dekate. "Cada tarea tenía su propio modelo. Por lo tanto, si tienes una tarea limitada de texto a texto, entonces los LLM funcionan bien".

Imprimir Subir

TE PUEDE INTERESAR...

Juan Fernando Muñoz (Ministerio de Sanidad)

ENTREVISTAS

“El futuro de la asistencia sanitaria pasa por el uso de los datos y de la IA”

EMPRESAS

IBM pone sus ojos en HashiCorp para reforzar su apuesta por la nube híbrida y la IA

ENTREVISTAS

“Las leyes deberían considerar el valor de la información que hace poderosa la IA”

EMPRESAS

Snowflake lanza Arctic, su LLM de código abierto

TECNOLOGÍA

Digitalización de la gestión de los viajes corporativos: retos y oportunidades

EMPRESAS

SAS Viya sube de escalafón al incorporar IA generativa y grandes modelos de lenguaje

EMPRESAS

Qualcomm avanza en su particular revolución del entorno del PC con Snapdragon X Plus

TENDENCIAS

La economía digital ya pesa un 24,2% en el PIB

TENDENCIAS

La transformación de la salud digital impulsada por la inteligencia artificial

TENDENCIAS

El futuro de la salud: avances tecnológicos y oportunidades en el sector sanitario

OPINIÓN

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

TENDENCIAS

'ComputerWorld' y SEIS analizan la inversión TIC en sanidad en 2023

Mayte Ledo, secretaria de Estado de Digitalización e IA; José Luis Escrivá, ministro para la Transformación Digital; Mercedes Oblanca, presidenta de Accenture España y Portugal; y Alberto García Arrieta, managing director y responsable de AI & Data.

Accenture cimenta su apuesta por la IA y lanza sus nuevos GenAI Studios en Madrid y Barcelona

EMPRESAS

Miguel Sánchez Galindo, nuevo director general de DigitalES

EMPRESAS

José Andrés García Bueno dirigirá el negocio de Qlik en Iberia

TENDENCIAS

Especial Administraciones Públicas

Contenido Patrocinado

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

18 ABR 2024

En la edición de este año, que se celebrará el próximo 7 de mayo en Berlín, la tecnológica reunirá a diversas industrias y ecosistemas para debatir en torno al proceso de adopción de infraestructuras de datos capaces de acelerar la IA.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

Gemini, de Google, avanza hasta una IA generativa multimodelo

TE PUEDE INTERESAR...

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365