Tecnología | Noticias | 21 AGO 2018

¿Qué persigue Salesforce al liberar el código de su tecnología de IA?

El proveedor de CRM está abriendo el código fuente de la tecnología de 'machine learning' que está detrás de su plataforma Einstein de inteligencia artificial. Shubha Nabar, directora senior de ciencias de la información del equipo de Salesforce Einstein, explica por qué.
open source
Scott Carey

TransmogrifAI, la librería AutoML, tiene menos de 10 líneas de código Scala escritas sobre Apache Spark, y puede ser usada por desarrolladores que buscan entrenar modelos de aprendizaje de máquinas con objeto de predecir el comportamiento del cliente sin tener que usar un gran conjunto de datos para la formación. “Fue desarrollado con el objetivo de acelerar la productividad de los desarrolladores de ‘machine learning’ a través de la automatización de esta tecnología y una API que refuerza la seguridad en el tiempo de compilación, la modularidad y la reutilización. A través de la automatización, alcanza precisiones cercanas a las de los modelos realizados mano con una reducción de tiempo de casi 100 veces”, afirman desde TransmogrifAI.

En un extenso artículo de Medium, Shubha Nabar, directora senior de ciencias de la información del equipo de Salesforce Einstein, apunta: “Hace tres años, cuando nos propusimos crear capacidades de aprendizaje automático en la plataforma de Salesforce, vimos que el desarrollo de sistemas de aprendizaje automático a escala empresarial es aún más difícil”.

La clave para Salesforce durante el desarrollo de Einstein fue ser capaz de ofrecer información inteligente y acciones recomendadas sin poner en común todos los datos de sus clientes. Esto supuso un gran reto para el proveedor antes de que adquiriera un grupo de empresas especializadas en el aprendizaje de máquinas, entre las que se encuentran MetaMind y su fundador, Richard Socher, que ahora es jefe científico en Salesforce.

“Hasta ese momento, si no se podían ver o normalizar los datos, no se podía aplicar la inteligencia”, según Marc Benioff, CEO de Salesforce. “Tenemos cantidades masivas de datos, petabytes y petabytes, así que tenemos los datos que necesitamos y la respuesta es que ahora podemos operar con esos datos sin interferir con la relación de confianza con nuestros clientes”.

Apuesta por la automatización

Sobre ello, Nabar escribe: “Tenemos que construir modelos de aprendizaje de máquinas específicos para cada caso de uso. Incluso si pudiéramos construir modelos globales, no tiene ningún sentido hacerlo porque los datos de cada cliente son únicos, con diferentes esquemas, diferentes formas y diferentes sesgos introducidos por diferentes procesos de negocio. Para que el aprendizaje de máquinas funcione realmente para nuestros clientes, tenemos que construir e implantar miles de modelos personalizados de aprendizaje de máquinas formados en los datos de cada cliente individual para cada caso de uso. La única manera de lograr esto sin contratar a un ejército de científicos de datos es a través de la automatización”.

Nabar explica que la mayoría de las soluciones de hoy en día están muy enfocadas a una pequeña parte de todo el flujo de trabajo del ‘machine learning’ o están construidas para datos desestructurados y homogéneos para imágenes, voz y lenguaje. “Pero necesitábamos una solución que pudiera producir rápidamente modelos de datos eficientes para datos estructurados heterogéneos a escala masiva”, apunta. El producto final es una forma de construir un modelo de aprendizaje de máquina único y modular que puede funcionar a través de conjuntos de datos más pequeños y personalizados, dando la impresión de múltiples modelos específicos de dominio.

Así, con sólo unas pocas líneas de código, una científica de datos puede automatizar la limpieza de datos, la ingeniería de características y la selección de modelos para llegar a un modelo de alto rendimiento desde el cual puede explorar e iterar más. “TransmogrifAI ha supuesto una transformación para nosotros y ha permitido a nuestros científicos de datos desplegar miles de modelos en producción con un ajuste manual mínimo y reduciendo el tiempo de respuesta promedio para la capacitación de un modelo de alto rendimiento de semanas a sólo un par de horas”.

Respecto a por qué Salesforce ha decidido llevar este proyecto a la comunidad de código abierto, Nabar comenta: “Salesforce ha sido un usuario y colaborador de Apache Spark y estamos encantados de seguir construyendo TransmogrifAI junto con la comunidad. El aprendizaje automático tiene el potencial de transformar el funcionamiento de las empresas, y creemos que las barreras a la adopción sólo pueden reducirse mediante un intercambio abierto de ideas y códigos. Trabajando en un entorno abierto podemos reunir diversas perspectivas para seguir impulsando la tecnología y hacerla accesible a todos”.

 

 

 

 

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios