IA
Tecnología
IA generativa

Voice Engine: con 15 segundos de escucha es capaz de clonar una voz

Dados los riesgos potenciales derivados de la tecnología basada en voces sintéticas desarrollada por OpenAI, la tecnológica ha frenado su lanzamiento al público.

deepl learning

OpenAI ha hecho de la carrera por la inteligencia artificial (IA) su particular meta. Y aunque la compañía que capitanea Sam Altman podría haberse conformado con el éxito cosechado con el popular ChatGPT, lo cierto es que esto parece haberles empujado a ampliar su abanico de soluciones basadas en la tecnología de IA generativa. En febrero del presente año, la compañía presentaba en sociedad Sora, la herramienta capaz de crear escenas realistas e imaginativas a partir de instrucciones de texto. “Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real”, aseguraban entonces fuentes corporativas.

Ahora, la firma que nació originalmente como una organización sin ánimo de lucro parece haber dado un paso más allá al navegar entre las oportunidades que representan las voces sintéticas. De hecho, los de Altman han anunciado un nuevo proyecto bautizado como Voice Engine, un modelo que utiliza entrada de texto y una única muestra de audio de 15 segundos para generar un habla con sonido natural que se parece mucho al hablante original. “Desarrollamos Voice Engine por primera vez a finales de 2022 y lo hemos utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como ChatGPT Voice y Read Aloud”, reza el comunicado emitido por OpenAI.

Sin embargo, dados los riesgos potenciales que puede tener la citada tecnología, la organización ha asegurado haber adoptado “un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética. Esperamos iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades”. Así, partiendo de estas conversaciones y los resultados de las pruebas a pequeña escala, “tomaremos una decisión más informada sobre si implementar esta tecnología para uso general y cómo hacerlo”.

 

Con miras al futuro

Voice Engine es una continuación de la aspiración de OpenAI por comprender la frontera técnica y compartir abiertamente lo que es posible con la IA. “De acuerdo con nuestro enfoque sobre la seguridad de la IA y nuestros compromisos voluntarios, decidimos hacer una vista previa de esta tecnología, pero no lanzarla ampliamente en este momento”, explican. Con esta vista previa de Voice Engine la compañía espera realzar su potencial y reforzar la resiliencia de la sociedad frente a los desafíos que plantean modelos generativos cada vez más convincentes.



Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital