Microsoft impulsa la eficiencia y rendimiento de sus servicios de IA y 'cloud' con los chips Maia AI y Azure Cobalt

Se espera que los nuevos chips de Microsoft, junto con otros personalizados de empresas como AWS, Google y Oracle, aunque inicialmente tengan un impacto limitado, constituyan una dura competencia para fabricantes de microprocesadores como Nvidia, AMD e Intel, según los analistas.

Anirban Ghoshal
16 NOV 2023

Tras meses de especulaciones sobre la posibilidad de que Microsoft estuviera desarrollando sus propios semiconductores, la compañía presentó el miércoles en su conferencia anual Ignite dos nuevos chips personalizados, bautizados como Maia AI Accelerator y Azure Cobalt CPU, dirigidos a cargas de trabajo de IA generativa y computación en nube, respectivamente.

Según Microsoft, el nuevo Maia 100 AI Accelerator alimentará algunas de las cargas de trabajo de IA internas más pesadas de la empresa que se ejecutan en Azure, incluidas las cargas de trabajo de formación de modelos e inferencia de OpenAI.

Sam Altman, consejero delegado de OpenAI, compañía respaldada por Microsoft, afirmó en un comunicado de prensa que el chip Maia personalizado ha allanado el camino para que la empresa de IA entrene modelos más capaces de una manera que se traducirá en menores costes para los clientes finales.

Los analistas están de acuerdo con esta afirmación. "Microsoft está creando sus propios procesadores de IA para mejorar el rendimiento por vatio y el rendimiento por dólar frente a las ofertas de Nvidia", afirma Dylan Patel, analista de la consultora Semianalysis. En última instancia, la reducción de costes repercutirá en los clientes que se suscriban a las ofertas de Azure de IA e IA generativa, añadió.

La CPU Azure Cobalt 100, basada en la arquitectura Arm, es también un intento de Microsoft de hacer su infraestructura más eficiente desde el punto de vista energético en comparación con las CPU comerciales de AMD e Intel, según Patel. La arquitectura Arm de la CPU Cobalt 100 permite a Microsoft generar más potencia de cálculo por cada unidad de energía consumida, dijo la empresa, que añadió que estos chips se utilizarán en todos sus centros de datos.

"Estamos haciendo el uso más eficiente de los transistores en el silicio. Si multiplicamos ese aumento de la eficiencia en los servidores de todos nuestros centros de datos, la cifra es bastante grande", declaró en un comunicado de prensa Wes McCullough, vicepresidente corporativo de desarrollo de productos de hardware de Microsoft.

Microsoft anuncia la noticia en un momento en el que se espera que el gasto en nube pública aumente significativamente. Según un informe de Gartner, se prevé que el gasto de los usuarios finales en servicios de nube pública crezca un 20,4% hasta alcanzar un total de 678.800 millones de dólares en 2024, frente a los 563.600 millones de dólares de 2023.

Nueva forma de refrigerar los nuevos chips Maia 100 Accelerator

Microsoft ha tenido que crear un nuevo diseño de los bastidores de sus centros de datos para alojar los chips Maia 100 Accelerator en su interior. Los bastidores, que son más anchos que los existentes, se han ampliado para dejar espacio suficiente para los cables de alimentación y de red, explica la empresa, que añade que ha tenido que diseñar una solución de refrigeración líquida independiente, diferente de los métodos de refrigeración por aire existentes, para gestionar la temperatura de los chips debido a las cargas de trabajo intensivas de IA y de IA generativa.

Para implementar la refrigeración líquida, Microsoft ha desarrollado un "sidekick" que se coloca junto al bastidor de los chips Maia 100. Estos "sidekicks", según Microsoft, funcionan un poco como el radiador de un coche.

"El líquido frío fluye desde el 'sidekick' hasta las placas frías que están pegadas a la superficie de los chips Maia 100. Cada placa tiene canales por los que pasa el líquido. Cada placa tiene canales por los que circula líquido para absorber y transportar el calor. Éste fluye hasta el 'sidekick', que elimina el calor del líquido y lo devuelve a la rejilla para que absorba más calor, y así sucesivamente", explica un portavoz de la empresa.

La economía y la sostenibilidad, claves de los chips a medida

La economía, y no la escasez de chips, es el principal motor de los microprocesadores personalizados para los grandes proveedores de servicios en la nube, como Microsoft, AWS y Google, según los analistas.

"La decisión de Microsoft de desarrollar silicio a medida, desde el punto de vista económico, le permite integrar sus ofertas y seguir optimizando el silicio para sus servicios, al tiempo que aumenta el margen y tiene un mejor control de los costes y la disponibilidad", afirma Daniel Newman, CEO de The Futurum Group.

Estas mismas razones, según Newman, llevaron a AWS a desarrollar sus propios chips personalizados. Mientras que AWS tiene sus chips Inferentia vinculados con el acelerador de aprendizaje automático Trainium, Google ha estado desarrollando iteraciones de sus chips Tensor.

"La CPU Cobalt tiene que ver con que Microsoft ofrezca un silicio optimizado para la nube y pueda ofrecer instancias basadas en Arm a los clientes de Azure, del mismo modo que hace AWS con EC2", afirma Newman.

Además, los analistas creen que los nuevos chips proporcionan una ventana de oportunidad para que Microsoft construya sus propios marcos de software acelerador de IA a medida que la demanda de IA o IA generativa crece aún más.

La creación de aceleradores para cargas de trabajo de IA será una forma de mejorar el rendimiento consumiendo menos energía que otros chips como las unidades de procesamiento gráfico (GPU). Aumentar el rendimiento al tiempo que se ahorra energía seguirá siendo cada vez más importante para los proveedores y las empresas en su intento de cumplir los objetivos de sostenibilidad y beneficiarse del potencial de la IA", afirma Newman.

Chips personalizados para competir con Nvidia, AMD e Intel

Los nuevos chips personalizados de Microsoft no son lo bastante potentes para sustituir a las GPU de Nvidia en el desarrollo de grandes modelos lingüísticos. Pero son muy adecuados para la inferencia (que se utiliza en las cargas de trabajo operativas de IA) y, a medida que se vayan desplegando, reducirán la necesidad de que la empresa utilice chips de Nvidia, AMD e Intel, según los analistas, que añaden que los chips personalizados de AWS y Google también desafiarán a los fabricantes de chips en el futuro.

"Intel, Nvidia y AMD están observando el auge de las instancias basadas en Arm y deberían verlas como una amenaza competitiva en determinadas instancias", dice Newman, de Futurum Group. Este añade que la migración de cargas de trabajo de chips de arquitectura x86 a Arm aún no es plug and play, ya que el software suele escribirse para arquitecturas de chip específicas, pero se ha convertido en un punto menos conflictivo a medida que los desarrolladores siguen avanzando en la ejecución de cada vez más cargas de trabajo en Arm.

Los analistas afirman que, dado que los proveedores de servicios en la nube utilizan silicio personalizado a distintos niveles, el mercado de centros de datos experimentará un "cambio más significativo" hacia Arm en los próximos años, a pesar de que los chips x86 dominan actualmente la cuota de mercado por un margen sustancial.

De todos los fabricantes de chips, Newman cree que Nvidia será el menos afectado, al menos a corto plazo, ya que la demanda de sus GPU seguirá siendo elevada. Sin embargo, en algunos casos o usos, los chips personalizados de los proveedores de servicios en la nube pueden establecer una relación simbiótica con Nvidia, especialmente los chips Grace Hopper, destinados al desarrollo y entrenamiento de grandes modelos lingüísticos.

Se espera que los nuevos chips personalizados de Microsoft empiecen a desplegarse a principios del año que viene en sus centros de datos. Como Microsoft no tiene previsto vender los chips a terceros, no tendrá que hacer frente a las restricciones impuestas por la administración del Presidente estadounidense Joe Biden a las exportaciones tecnológicas a China.

Imprimir Subir

TE PUEDE INTERESAR...

Juan Fernando Muñoz (Ministerio de Sanidad)

ENTREVISTAS

“El futuro de la asistencia sanitaria pasa por el uso de los datos y de la IA”

EMPRESAS

IBM pone sus ojos en HashiCorp para reforzar su apuesta por la nube híbrida y la IA

ENTREVISTAS

“Las leyes deberían considerar el valor de la información que hace poderosa la IA”

EMPRESAS

Snowflake lanza Arctic, su LLM de código abierto

TECNOLOGÍA

Digitalización de la gestión de los viajes corporativos: retos y oportunidades

EMPRESAS

SAS Viya sube de escalafón al incorporar IA generativa y grandes modelos de lenguaje

EMPRESAS

Qualcomm avanza en su particular revolución del entorno del PC con Snapdragon X Plus

TENDENCIAS

La economía digital ya pesa un 24,2% en el PIB

TENDENCIAS

La transformación de la salud digital impulsada por la inteligencia artificial

TENDENCIAS

El futuro de la salud: avances tecnológicos y oportunidades en el sector sanitario

OPINIÓN

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

TENDENCIAS

'ComputerWorld' y SEIS analizan la inversión TIC en sanidad en 2023

Mayte Ledo, secretaria de Estado de Digitalización e IA; José Luis Escrivá, ministro para la Transformación Digital; Mercedes Oblanca, presidenta de Accenture España y Portugal; y Alberto García Arrieta, managing director y responsable de AI & Data.

Accenture cimenta su apuesta por la IA y lanza sus nuevos GenAI Studios en Madrid y Barcelona

EMPRESAS

Miguel Sánchez Galindo, nuevo director general de DigitalES

EMPRESAS

José Andrés García Bueno dirigirá el negocio de Qlik en Iberia

TENDENCIAS

Especial Administraciones Públicas

Contenido Patrocinado

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

18 ABR 2024

En la edición de este año, que se celebrará el próximo 7 de mayo en Berlín, la tecnológica reunirá a diversas industrias y ecosistemas para debatir en torno al proceso de adopción de infraestructuras de datos capaces de acelerar la IA.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

Microsoft impulsa la eficiencia y rendimiento de sus servicios de IA y 'cloud' con los chips Maia AI y Azure Cobalt

Nueva forma de refrigerar los nuevos chips Maia 100 Accelerator

La economía y la sostenibilidad, claves de los chips a medida

Chips personalizados para competir con Nvidia, AMD e Intel

TE PUEDE INTERESAR...

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365