Asistentes virtuales

Alexa aprende a modelar nuevos estilos de habla

Amazon tiene un nuevo sistema de inteligencia artificial para que los asistentes digitales de voz como Alexa puedan aprender nuevos estilos de discurso, por ejemplo, una voz impostada que suene a un lector de noticias.

Amazon Echo con Alexa

Según Trevor Wood, el gerente de ciencias aplicadas de Amazon, el nuevo sistema de texto a voz puede reemplazar los métodos tradicionales de entrenamiento de voz. Unos métodos, que requieren actores que graben su voz durante horas para entrenar a los modelos.

Wood explica que el habla sintética producida por redes neuronales suena mucho más natural para los usuarios que el habla producida a través de métodos tradicionales. En esta última forma, los fragmentos de voz cortos están vinculados entre sí en una base de datos de audio. Con la flexibilidad mejorada del sistema, Amazon puede cambiar fácilmente el estilo de voz del habla sintética.

NTTS

La propia Amazon llama al nuevo modelo "neural text-to-speech", o NTTS. Según ellos, hay dos componentes importantes. Una es una "red neuronal generativa", que funciona mediante la transformación de series de fonemas en series de espectrogramas. Estas son representaciones visuales del espectro de las frecuencias de esos sonidos, ya que cambian con el tiempo. Los espectrogramas deben enfatizar "las funciones que utiliza el cerebro humano para procesar el habla", dijo Wood.

El segundo componente es un vocoder, que ayuda a convertir esos espectrogramas en una señal de audio continua utilizada para entrenar el modelo de texto a voz. El nuevo método de entrenamiento puede combinar datos neuronales de texto a voz con algunas horas de datos adicionales para crear un modelo que pueda distinguir entre elementos de voz únicos para un estilo de voz específico.

Según Wood, la investigación de Amazon muestra que los oyentes tienen una fuerte preferencia por las voces hechas por NTTS. 

 



TE PUEDE INTERESAR...

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital