La revolución del "big data mining"

Empresas y organizaciones de todo tipo están interesadas en esta tecnología que permite analizar ingentes cantidades de datos

El concepto big data se refiere al incremento ingente del volumen de datos a almacenar y gestionar en las organizaciones (datos que incluyen información no estructurada como la que se publica en Facebook y Twitter) así como a las formas existentes para analizar esta información de modo que genere nuevas oportunidades de negocio. No obstante, este término también plantea la cuestión de quién es exactamente el propietario de estos datos.
Big data se asocia con tecnologías como la plataforma distribuida de ordenadores Apache Hadoop y está dando lugar a que algunas empresas tecnológicas, como IBM, estén realizando importantes adquisiciones. Pero, según la firma de análisis GigaOm, el término es poco apropiado, ya que realmente se refiere a datos de diferentes fuentes, lo que incluye los de las redes sociales o incluso de los teléfonos móviles.
Eso sí, todas las empresas de TI y las organizaciones en general están mostrando mucho interés por la tecnología que está detrás de este concepto que permite, por ejemplo, analizar la información del genoma humano o poner a disposición de todo el mundo los datos de las Administraciones Públicas. Teniendo en cuenta este creciente interés, no sorprende que los principales proveedores del mercado estén intentando sacar partido de esta tendencia. La adquisición del almacén de datos Netezza por parte de IBM es sólo una muestra de ello; así como la compra de Aster Data Systems, empresa de analítica y gestión avanzada de datos no estructurados, por parte de Teradata.

Extracción de ‘big data’ de las redes sociales
Hay empresas que ya están buscando un hueco en el negocio de los big data y en el segmento de los datos de las redes sociales. Tanto las empresas de TI como los usuarios individuales van a empezar a apreciar cada vez más servicios disponibles para trabajar con los llamados big data, a medida que la recopilación de datos vaya creciendo en importancia.
Ya hay, por ejemplo, empresas que ofrecen a otras compañías, como medios de comunicación y agencias de publicidad, la recopilación de los datos que hay en medios sociales relevantes para un cliente. De este modo, los clientes pueden crear experiencias en tiempo real a partir de los datos, obteniendo un juego colosal de datos unificados para el desarrollo de aplicaciones como foros y blogs en vivo. Es más, la distribución de Hadoop permite a las organizaciones recopilar y combinar datos sociales y guardarlos en un almacén de datos centralizado, para analizar diversos aspectos posteriormente.

¿de quién son los datos?
En cualquier caso, la duda que surge ante este escenario en el que los datos cada vez son más numerosos es: ¿de quién son todos estos datos? Según la consultora GigaOm, la propiedad de los datos es de aquellas empresas que los generan. Aunque, en el caso de las redes sociales, como Facebook y Twitter, estas empresas son las propietarias de los datos que sus usuarios generan. Debido a este aspecto, ya hay firmas que analizan las transmisiones de Twitter mes a mes. Es más, aunque Google ofrezca a los usuarios el derecho de eliminar datos, sigue siendo el propietario de los mismos. Aunque no hay que olvidar que hay proyectos, como el llamado Data Portability (portabilidad de datos), que se ocupa de la transferencia de los datos de las redes sociales, que promueve la idea de que los usuarios son los propietarios de sus propios datos y, de este modo, las redes sociales deberían de facilitar a los usuarios su circulación.
Pero el problema de la propiedad de los datos no reside sólo en su privacidad. Uno de los principios de big data es analizar los datos provenientes de múltiples fuentes para identificar tendencias, oportunidades de negocio, cambios en los mercados, clientes potenciales, opiniones de los clientes y mucho más. Cuando estas herramientas analizan la información disponible en la Web, ¿tienen realmente derecho a hacerlo sin permiso del propietario? Hay expertos que aseguran que al publicar algo en sitios públicos de Internet, el contrato social es tal que la gente espera que sus datos se sondeen, procesen, indexen y se utilicen. Aunque otros analistas no lo tienen tan claro.

Revista Digital

Revista Digital mayo

Portada CW 1388 Tendencias

Webinars

Cloudscape 2021 OK Webinars

T-Systems webinar Sanidad Webinars
Registro IDG España:

Eventos IDG:

 

Accelerate Digital Now

Be Data Ready

evento innovación

Modern Data Experience

Partnerzones IDG
Especiales IDG:
Revistas Digitales IDG

ComputerWorld Digital

CSO España Digital

DealerWorld Digital

IDG Research

 

Ya disponible en IDG Research: