ChatGPT amplía sus capacidades: ‘verá, oirá y hablará’

El chatbot más popular de OpenAI despliega nuevas funciones de voz e imagen, brindando un nuevo tipo de interfaz más intuitiva al permitirte mantener una conversación de voz e interactuar usando fotografías.

Despliegue gradual

El objetivo de OpenAI pasa por construir una inteligencia artificial “segura” y “beneficiosa”. Precisamente por este motivo consideran que sus herramientas deben estar disponibles de forma gradual, ya que esto “nos permite introducir mejoras y perfeccionar la mitigación de riesgos a lo largo del tiempo, mientras preparamos a todo el mundo para sistemas más potentes en el futuro”. Esta estrategia, han incidido, es aún más importante con los modelos avanzados de voz y visión.

La nueva tecnología de voz -capaz de crear voces sintéticas realistas a partir de unos pocos segundos de habla real- “abre las puertas a muchas aplicaciones creativas y centradas en la accesibilidad”. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores malintencionados se hagan pasar por figuras públicas o cometan fraudes.

Por eso han optado por utilizar esta tecnología para un caso de uso específico: el chat de voz. “El chat de voz se ha creado con actores de doblaje con los que hemos trabajado directamente”, aunque también están colaborando de forma similar con otros. Por ejemplo, Spotify está utilizando la potencia de esta tecnología para el proyecto piloto de su función de traducción de voz, que ayuda a los creadores de podcast a ampliar el alcance de sus narraciones traduciendo los podcast a otros idiomas con su propia voz.

Pero los modelos de visión también plantean sobre la mesa nuevos desafíos, que van desde las elucubraciones sobre las personas hasta la confianza en la interpretación de las imágenes por parte del modelo en ámbitos de alto riesgo. “Antes de generalizar el despliegue, probamos el modelo con equipos rojos de riesgo en ámbitos como el extremismo y la competencia científica, y con un conjunto diverso de probadores alfa”. En este sentido, dicen, la investigación les permitió centrarse en algunos detalles clave para un uso responsable.

Una visión útil y segura

Al igual que otras funciones de ChatGPT, la visión pretende ayudar a los usuarios en su vida diaria. Y lo hace mejor cuando puede ver lo que tú ves. Este enfoque se ha basado directamente en su trabajo con Be My Eyes, una aplicación móvil gratuita para invidentes y personas con baja visión, para comprender sus usos y limitaciones. “Los usuarios nos han dicho que les resulta valioso mantener conversaciones generales sobre imágenes en las que aparecen personas de fondo, por ejemplo, si aparece alguien en la tele mientras intentas averiguar cómo se ajusta el mando a distancia”.

También han tomado medidas técnicas para limitar significativamente la capacidad de ChatGPT de analizar y hacer afirmaciones directas sobre las personas, ya que ChatGPT no siempre es preciso y estos sistemas deben respetar la privacidad de las personas. “El uso en el mundo real y los comentarios nos ayudarán a mejorar aún más estas salvaguardas sin que la herramienta deje de ser útil”, han defendido.

Transparencia sobre las limitaciones del modelo

Los usuarios pueden depender de ChatGPT para temas especializados; por ejemplo, en campos como la investigación. “Somos transparentes sobre las limitaciones del modelo y desaconsejamos los casos de uso de mayor riesgo sin una verificación adecuada”. Además, han destacado, el modelo es competente en la transcripción de textos en inglés, pero no funciona bien con otros idiomas, especialmente los que no tienen escritura romana. “Aconsejamos a nuestros usuarios que no hablan inglés que no utilicen ChatGPT para este fin”.

Imprimir Subir

TE PUEDE INTERESAR...

Juan Fernando Muñoz (Ministerio de Sanidad)

ENTREVISTAS

“El futuro de la asistencia sanitaria pasa por el uso de los datos y de la IA”

EMPRESAS

IBM pone sus ojos en HashiCorp para reforzar su apuesta por la nube híbrida y la IA

ENTREVISTAS

“Las leyes deberían considerar el valor de la información que hace poderosa la IA”

EMPRESAS

Snowflake lanza Arctic, su LLM de código abierto

TECNOLOGÍA

Digitalización de la gestión de los viajes corporativos: retos y oportunidades

EMPRESAS

SAS Viya sube de escalafón al incorporar IA generativa y grandes modelos de lenguaje

EMPRESAS

Qualcomm avanza en su particular revolución del entorno del PC con Snapdragon X Plus

TENDENCIAS

La economía digital ya pesa un 24,2% en el PIB

TENDENCIAS

La transformación de la salud digital impulsada por la inteligencia artificial

TENDENCIAS

El futuro de la salud: avances tecnológicos y oportunidades en el sector sanitario

OPINIÓN

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

TENDENCIAS

'ComputerWorld' y SEIS analizan la inversión TIC en sanidad en 2023

Mayte Ledo, secretaria de Estado de Digitalización e IA; José Luis Escrivá, ministro para la Transformación Digital; Mercedes Oblanca, presidenta de Accenture España y Portugal; y Alberto García Arrieta, managing director y responsable de AI & Data.

Accenture cimenta su apuesta por la IA y lanza sus nuevos GenAI Studios en Madrid y Barcelona

EMPRESAS

Miguel Sánchez Galindo, nuevo director general de DigitalES

EMPRESAS

José Andrés García Bueno dirigirá el negocio de Qlik en Iberia

TENDENCIAS

Especial Administraciones Públicas

Contenido Patrocinado

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

18 ABR 2024

En la edición de este año, que se celebrará el próximo 7 de mayo en Berlín, la tecnológica reunirá a diversas industrias y ecosistemas para debatir en torno al proceso de adopción de infraestructuras de datos capaces de acelerar la IA.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

ChatGPT amplía sus capacidades: ‘verá, oirá y hablará’

Despliegue gradual

Una visión útil y segura

Transparencia sobre las limitaciones del modelo

TE PUEDE INTERESAR...

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365