Big Data

La verdad tras los datos

El 'big data' no es una moda pasajera que olvidaremos en poco tiempo. Prueba de ello es que muchas empresas ya cuentan con científicos de datos en sus plantillas para ayudarles a sacar el verdadero valor oculto entre sus datos.

big data

 

La Casa Blanca acaba de nombrar a su primer Chief Data Officer al servicio del Gobierno de los Estados Unidos como apuesta clara por la innovación y el emprendimiento. Y no es la primera vez que el Gobierno de Estados Unidos hace uso del big data. Ya lo hizo durante la campaña de Barack Obama en el 2012, creando un departamento de analítica para optimizar la comunicación y mejorar la respuesta de los ciudadanos, optimizando recursos, tiempo y dinero en los votantes que no eran partidarios de su partido.

 

Los datos se han convertido, o lo harán en un breve espacio de tiempo, en el activo tangible más valioso y con más potencial de las empresas. Se trata sin duda, de una afirmación tajante y llena de posibilidades. Para mí hay dos puntos relevantes en esta afirmación, uno es la cantidad de datos y la otra es la calidad de los mismos.

 

En cuanto a la cantidad, creo que no hay ninguna duda de que estamos ante un cambio histórico en lo que se refiere a la generación de datos. Tan sólo en el último año se generaron más datos que en 50 siglos de historia y la tendencia es de crecimiento exponencial de los mismos.

 

Cada día se generan millones y millones de datos. Y no estoy hablando de ciencia ficción, estoy hablando de la cantidad de datos que generamos en el día a día, en cada una de nuestras empresas, en cada uno de nuestros hogares con datos procedentes de sensores, de nuestros dispositivos móviles, de nuestros sistemas de gestión y, por supuesto, de internet y sus redes sociales. La verdad es que es impresionante el número de datos que generamos en un solo minuto. Para que nos hagamos una idea, os doy algunos números:

 

  • Más de 276.000 búsquedas en google
  • 38.040 descargas del AppleStore
  • 3.131.760 Likes en Facebook
  • 204.166.680 mails enviados
  • 13.194.420 WhatsApp enviados

 

En tan sólo 60 segundos, se envían más de un millón de GB a través de internet. ¿Abrumador, verdad? Y para los escépticos, lo pueden comprobar por si mismos en la siguiente web http://pennystocks.la/internet-in-real-time/, donde se recoge el tráfico generado en internet en algunas de las principales páginas.

 

El segundo punto que mencionaba es la calidad, entendiéndola desde dos puntos de vista. La calidad como pureza y exactitud del dato, y calidad como habilitador para conseguir beneficios de los mismos.

 

Está claro que todos estos datos hay que capturarlos y tratarlos para eliminar impurezas en los mismos que nos desvirtúen los resultados. Esto hace unos años era algo complejo, hoy en día y gracias a las tecnologías disponibles, podemos capturar toda esta información en tiempo-real, para luego almacenarla, si es necesario, o analizarla al vuelo sin necesidad de guardarla. La pureza del dato es fundamental y para conseguirla existen soluciones de limpieza del dato (datacleansing) que nos pueden ayudar a depurar toda esta información. No quiero entrar en tecnicismos, ni listar una serie de soluciones que nos permitan hacerlo. Simplemente diré que no sólo es posible, sino que cada vez está más difundido entre las empresas.

 

Pero podemos tener muchos datos y muy depurados, y que no nos sirva para nada. Ahí entra la segunda acepción de calidad. Los datos tienen que proporcionarnos ventajas competitivas, tienen que proporcionarnos valor y aquí es donde radica la complejidad de todo esto, sin quitar importancia todo lo anterior, por supuesto.

 

Muchas empresas tienen ya sus datos depurados, o están capacitados para hacerlo, pero se hacen la eterna pregunta… ¿Y ahora qué? ¿Cómo saco valor a estos datos?

 

Obtener patrones ocultos, tendencias y correlaciones entre los mismos, nos pueden ayudar a obtener el verdadero valor de los datos y darnos esa ventaja competitiva. Para ello, cuántos más datos tengamos y más datos procedentes de diversas fuentes consigamos cruzar, mayores serán nuestras opciones de desmarcarnos de la competencia. Hay que analizar la información desde todos los puntos de vista posibles para poder sacar una idea clara de lo que está pasando y de lo que puede pasar si nos comportásemos de una forma determinada. Hay que analizar la realidad con toda la información posible y no sólo desde un punto de vista. Este concepto holístico de los datos me recuerda a la parábola de los ciegos y el elefante, que ha sido utilizada para ilustrar la incapacidad del hombre para conocer la totalidad de la realidad. Esta parábola cuenta como diversos monjes ciegos explican su realidad al tocar a un elefante, uno dijo que era un árbol al agarrar la pata, otro que era una cuerda al sostener la cola, el que sostuvo la trompa dijo que era una rama y el que tocó la oreja dijo que era un mapa. Todos ellos tenían creían tener razón, pero partían de información incompleta.

 

A día de hoy ya existen empresas que se encargan exclusivamente en generar, recolectar y vender datos a otras empresas para aportarles estos beneficios. Es el negocio de los próximos años, saber generar, capturar y cruzar los datos para detectar patrones ocultos que nos desvelen como tenemos que actuar para anticiparnos al futuro. Ya no sólo bastará con saber que es más probable que ocurra en el futuro, sino que es lo que tengo que hacer para que el futuro se comporte como yo quiero. Por supuesto todo ello basado en porcentajes de probabilidad de ocurrencia, para lo que nos tendremos que apoyar en modelos estadísticos y algoritmos de cálculo más o menos complejos y en profesionales que aglutinen cualidades técnicas, estadísticas y de negocio, lo que se conoce como data scientists.

 

Todo esto no dejaría de ser palabras y buenos deseos si no fuese porque cada día hay más ejemplos de uso entre nosotros, que se están introduciendo en nuestro día a día sin apenas darnos cuenta. Desde hace unas semanas, cuando me salta una alerta en el móvil para avisarme de mi próxima cita en el calendario, también me dice cuanto tiempo voy a tardar en llegar a dicha reunión, teniendo en cuenta mi ubicación actual, el destino y el tráfico que hay en ese momento. O cuando entras en una página web a buscar un producto determinado te sugiere otros productos similares de forma automática. O como gracias a la combinación de grandes cantidades de datos, por ejemplo, datos epidemiológicos, con las redes sociales se están usando para generar mapas de evolución de la gripe en una determinada zona. Esto no sólo es útil para conocer la evolución de la gripe en nuestra comunidad, sino que también lo podemos utilizar para saber el riesgo en nuestro entorno cercano, alrededor del domicilio y el trabajo.

 

De una manera u otra, todo está relacionado con los datos y como exprimirlos al máximo. De ahí viene el papel tan importante que están jugando, su gran potencial y porqué constituyen el activo tangible más valioso de las empresas. ¿Te atreves a buscar con nosotros que hay detrás de tus datos?

 

El autor de este artículo es David Llamas, DATA Practice Director de Techedge España

 



Contenido Patrocinado

Fernando Rubio Román, CTO de Microsoft España. TECNOLOGÍA
Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital