Tecnología | Noticias | 19 DIC 2016

Microsoft abre un paquete de datos para avanzar en las conversaciones con máquinas

Tags: Microsoft
MS MARCO es un conjunto de preguntas y respuestas diseñadas para mejorar la comprensión de lectura de las máquinas.
edificio microsoft
Blair Hanley Frank

 

Microsoft está tratando de ayudar a crear máquinas que puedan tener conversaciones mediante la liberación gratuita de una nueva serie de datos.

Los datos, llamados Microsoft Machine Reading Comprehension dataset (MS MARCO), se aglutinan en un paquete de más de 100.000 consultas en inglés junto con las respuestas correspondientes. Éste, se supone que debe ayudar a la construcción de sistemas de inteligencia artificial que puedan entender el lenguaje escrito humano.

La tecnológica de Redmond está abriendo su conjunto de datos “con la esperanza de poder trabajar con otras máquinas en la comprensión de la lectura”, ha explicado Rangan Majumder, director de programa del Microsoft Partner Group, en un blog publicado el viernes.

Las consultas en MS MARCO se basan en preguntas anónimas que se enviaron a la herramienta de búsqueda Bing y al asistente virtual Cortana. Y, las respuestas se basan en la información encontrada en línea, escrita por humanos y verificadas con exactitud. Éstas se crean para el uso con modelos de deep learning.

Por el momento, esta base de datos es gratis para todos aquellos que planean su uso sin ánimo de lucro. Así, Microsoft lo comparte de la misma manera en que también abre otros conjuntos de datos para entrenar programas de inteligencia artificial. Uno de ellos es ImageNet, una base de datos de imágenes etiquetadas que se utiliza para entrenar algoritmos de reconocimiento. La compañía ya utilizó esa base de datos en el desarrollo de la tecnología de reconocimiento de imágenes que ahora sustenta productos como el Microsoft Computer Vision API.

Las personas que quieran saber más acerca de MS MARCO pueden descargar un documento de investigación escrito por el equipo de Microsoft que lo construyó. A su vez, el equipo también está preparando un reto que evaluará modelos entrenados usando los datos MS MARCO.

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios