Actualidad
Análisis
Oracle
IA generativa

Oracle ha mejorado su estrategia de IA generativa, según los analistas

Oracle ofrece un enfoque más ágil para reducir los costes de capacitar continuamente a los LLM en conocimiento de la organización, aunque está por detrás de sus rivales en servicios de IA generativa.

Oracle edificio

Las recientes actualizaciones de Oracle a su servicio OCI Generative AI, que compite con servicios similares de sus rivales AWSMicrosoft y Google, están en sintonía con las necesidades futuras de las empresas, dicen los analistas. Pero Oracle puede estar muy por detrás de sus rivales en términos IA generativa y ofertas de servicios.

"Oracle puede ofrecer a las empresas un enfoque más optimizado para reducir el gasto y los recursos o el compromiso de tiempo para preentrenar, afinar y entrenar continuamente grandes modelos lingüísticos (LLM) en el conocimiento o los datos de una empresa, lo que ha demostrado ser un obstáculo en muchos de los entornos empresariales actuales, con la excepción de algunas aplicaciones de centro de llamadas y soporte de experiencia del cliente", dijo Ron Westfall, director de Investigación de The Futurum Group.

La diferenciación de Oracle, según Westfall, radica en su capacidad para impulsar la innovación generativa de la IA en toda la empresa, ya que se basa en una amplia gama de capacidades integradas en su cartera de aplicaciones Fusion y NetSuite, servicios e infraestructura de IA y aprendizaje automático (ML) para plataformas de datos, como MySQL HeatWave Vector Store y AI Vector Search en Oracle Database.

Mientras que AWS y Google parecen incapaces de contrarrestar la diversa gama de aplicaciones empresariales de Oracle directamente en cartera, rivales como IBM van a la zaga de Oracle en términos de oferta global de una base de datos en la nube, explicó Westfall.

 

La clave es reducir costes y complejidad

Westfall cree que Oracle ofrece grandes diferenciadores de rendimiento de precios en todas las categorías clave de bases de datos en la nube que pueden facilitar la adopción de IA generativa y el escalado en dichos entornos.

Ampliando la premisa de Westfall, Bradley Shimmin, analista jefe de la firma de investigación Omdia, afirmó que Oracle está tratando de integrar elementos fundamentales de la IA generativa en sus ofertas básicas, especialmente las bases de datos, para optimizar los recursos informáticos y abaratar costes.

A raíz de la vertiginosa innovación en torno a la IA generativa, los proveedores de servicios tecnológicos como Oracle comprenden que optimizar el uso del hardware es importante a la hora de desplegar un modelo de IA con miles de millones de parámetros a escala con un grado tolerable de latencia, según Shimmin.

"Estamos experimentando el mismo tipo de llamada de atención también en las áreas adyacentes de datos y análisis, en particular a medida que las bases de datos y las herramientas de procesamiento de datos empiezan a desempeñar un papel cada vez más importante en el apoyo a las ofertas basadas en IA generativa, como es el caso de casos de uso como la generación aumentada por recuperación", insistió.

Mientras que una cosa es construir una canalización básica de generación aumentada por recuperación (RAG) capaz de indexar unos pocos PDF para dar soporte a un LLM de un solo usuario, es un reto totalmente nuevo implementar RAG para petabytes de datos corporativos en continua evolución, y ofrecer perspectivas a partir de esos datos a una audiencia global en menos de un milisegundo, explicó el analista.

"No es de extrañar, por tanto, ver a tantos proveedores de bases de datos, como MongoDB, adoptar capacidades de aprendizaje automático en la base de datos y, más recientemente, crear, almacenar y recuperar incrustaciones vectoriales dentro de la misma base de datos en la que se encuentran los datos vectorizados. Se trata de minimizar la complejidad y maximizar el gasto", afirma Shimmin.

El principio subyacente es reducir el movimiento de datos entre dos bases de datos, entre bases de datos y medios de almacenamiento, y entre medios de almacenamiento y chips de inferencia de modelos.

Además, Shimmin dijo que las empresas, en muchos casos, pueden tener que mantener dos bases de datos separadas, una para los vectores y otra para los datos de origen, lo que resultará caro, ya que tendrán que pagar un precio en la gestión de la integración de datos y la latencia entre los dos.

"Empresas como Oracle, que han tratado de optimizar su infraestructura en la nube desde el procesamiento de la base de datos hasta la red de chips y la recuperación de datos, parecen bien posicionadas para ofrecer un valor diferenciado a sus clientes reduciendo la complejidad y elevando al mismo tiempo el rendimiento", explicó el analista.

 

“Muy por detrás” de sus rivales en modelos y servicios

Aunque la estrategia de Oracle puede resultar atractiva para los clientes empresariales, Andy Thurai, analista principal de Constellation Research, cree que Oracle está "muy por detrás" de sus rivales cuando se compara en función de las ofertas generales de IA generativa.

"La opción de Oracle de ofrecer un servicio alojado según las necesidades compite con una oferta mucho más potente de AWS, que cuenta con más opciones y funciones en comparación con la oferta de OCI", afirmó Thurai. Thurai también señaló que Oracle tiene escasez de LLM y que su uso es limitado en comparación con sus rivales.

Sin embargo, Thurai sostiene que la elección de Oracle de utilizar el servicio de IA generativa en Oracle Cloud y en las instalaciones a través de la región dedicada de OCI es una propuesta algo única que podría ser interesante para algunos clientes de grandes empresas, especialmente los de industrias reguladas.

"La opción de integrarse con las aplicaciones ERP, HCM, SCM y CX de Oracle que se ejecutan en OCI podría hacer que esto sea más atractivo, si tiene el precio adecuado, para su base de usuarios", dijo el analista, y agregó que no hacerlo ayudaría a AWS a tomar una posición más favorable con los clientes empresariales.

 

Novedades del servicio de IA generativa de OCI

Oracle lleva casi un año desplegando su estrategia de IA generativa de tres niveles en múltiples ofertas de productos. La empresa lanzó el servicio OCI Generative AI Service en versión beta en septiembre. Hoy Oracle ha introducido nuevos modelos de Cohere y Meta, nuevos agentes de IA, un nuevo marco de bajo código para gestionar los LLM de código abierto y ha generalizado la disponibilidad del servicio.

Los nuevos modelos incluyen Llama 2 70B de Meta, un modelo de generación de texto optimizado para casos de uso de chat, y las últimas versiones de los modelos de Cohere, como Command, Summarize y Embed. Estos modelos estarán disponibles en un servicio gestionado que podrá consumirse a través de llamadas a la API, afirma Oracle en un comunicado, en el que añade que estos modelos también podrán ajustarse mediante el servicio actualizado.

 

Un agente de IA para la generación aumentada por recuperación

Además de los nuevos modelos, Oracle ha añadido nuevos agentes de IA al servicio para ayudar a las empresas a sacar el máximo partido de sus datos empresariales al utilizar grandes modelos de lenguaje y crear aplicaciones generativas basadas en IA.

El primero de los agentes de IA introducidos en la versión beta es el agente RAG. Este agente, que funciona de forma similar a LangChain, combina la potencia de los LLM y la búsqueda empresarial basada en OCI OpenSearch para ofrecer resultados contextualizados y mejorados con datos empresariales, explica Vinod Mamtani, vicepresidente de Generative AI Services de OCI.

Cuando un usuario de empresa introduce una consulta en lenguaje natural en el agente RAG a través de una aplicación empresarial, la consulta se pasa a OCI OpenSearch, que es una forma de búsqueda vectorial o semántica. A su vez, OCI OpenSearch lee y recopila información relevante del repositorio de datos de la empresa. Los resultados de la búsqueda son clasificados por un LLM ReRanker, que pasa la clasificación a un LLM de generación de texto, que responde a la consulta en lenguaje natural.

El LLM de generación de texto realiza comprobaciones para garantizar que la respuesta devuelta está fundamentada o, en otras palabras, es adecuada para el consumo del usuario. Si la consulta devuelta no cumple los requisitos de fundamentación, el bucle se ejecuta de nuevo, explica la empresa, que añade que esto elimina la necesidad de especialistas como desarrolladores y científicos de datos.

 

Agentes de IA basados en el marco ReAct

Estos agentes de IA, según Oracle, se están creando con la ayuda del documento ReAct publicado por investigadores de la Universidad de Princeton y Google. Los agentes utilizan el marco ReAct para razonar, actuar y planificar basándose en una serie de pensamientos, acciones y observaciones.

Mamtani dijo que estas capacidades permitirán a los agentes ir más allá de las tareas de recuperación de información y llamar a API en nombre del usuario, así como automatizar otras tareas. Oracle también tiene previsto añadir al servicio agentes de varios turnos a los que se puede pedir que conserven la memoria de interacciones anteriores para enriquecer aún más el contexto del modelo y sus respuestas.

La mayoría de estos agentes y sus acciones, según la compañía, pueden añadirse a su conjunto de aplicaciones SaaS, incluyendo Oracle Fusion Cloud Applications Suite, Oracle NetSuite y aplicaciones industriales como Oracle Cerner.

Además, en un esfuerzo por ayudar a las empresas a utilizar y gestionar los LLM con bibliotecas de código abierto, Oracle está añadiendo una nueva capacidad a su oferta OCI Data Science, denominada AI Quick Actions feature. Esta función, que estará en fase beta el próximo mes, permite el acceso sin código a una variedad de LLM de código abierto.



Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

Webinars

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital