No hay aún una definición comúnmente aceptada. Algunos hablan “como todo lo referente al hecho de que los datos se han vuelto tan grandes que no se pueden procesar, almacenar y analizar mediante métodos convencionales” [Profesor Jordi Torres UPC, Del cloud computing al big data]
IBM, una de las firmas que más están apostando por esta tecnología habla de “crecimiento, disponibilidad y uso exponenciales de la información estructurada y desestructurada” y asocia su uso a que “puede ser la base para la innovación, la diferenciación y el crecimiento”
Por tanto estamos ante un fenómeno tecnológico en fase embrionaria, donde tanto los conceptos como las definiciones se están construyendo sobre la marcha y ante un territorio por explorar en cuanto a su utilización y aplicación.
Aunque no tengamos una definición consensuada si disponemos de unos atributos que diferencian a estos tipos de datos. Se habla de las 3 V del Big Data:
Volumen: aumento desmesurado de la cantidad de datos generada cada día, que plantea retos de almacenaje, definición de su importancia y creación de valor.
Velocidad: según Gartner «designa la rapidez con que se generan los datos y con la que deben procesarse para satisfacer la demanda». La proliferación de dispositivos, sensores, controladores, etiquetas inteligentes etc. hace que crezca una tipología de datos efímeros pero de alto valor empresarial. Reaccionar ante esta avalancha de datos puede ser fundamental para las organizaciones.
Variedad: aparecen una nueva generación de datos no estructurados (videos, imágenes, social media, documentos de texto, sensores etc. ) que requieren de nuevas formas de tratamiento y almacenaje. O datos externos a las propias organizaciones: organismos oficiales, datos públicos (Open Data) Además sus flujos de generación pueden ser irregulares con picos de crecimiento no predecibles. La dificultad de crear patrones y previsiones dificulta aún más el tratamiento tecnológico.
Algunos expertos añaden un cuarto atributo: complejidad. Afrontar esta diversidad, velocidad de crecimiento y su volumen supone un reto no sólo tecnológico para que la integración de datos estructurados y no estructurados pueda generar información de alta calidad útil, conveniente y actualizada.
Estamos por tanto ante un fenómeno tecnológico de magnitudes aún por descubrir. Sé que puede parecer excesivo, pero ¿que era internet al principio? Un fenómeno de laboratorio, destinado a usos militares y científicos, sin un lenguaje estandarizado y un futuro aún sin descubrir. Pensar en lo que era al principio y lo que es ahora, lo que ha generado en todos los sectores, los nuevos negocios, las nuevas formas de relaciones…
Sin duda big data es una oportunidad para el retail. Se habla ya más del valor de la información que el de las propias transacciones comerciales. De hecho el gigante Walmart gestiona un millón de transacciones por hora que alimenta una base de datos de unos 2,5 Petabytes. Esta cantidad de datos debe ser almacenada, tratada, refinada, priorizada y analizada. Si se hace bien, la información generada se convertirá en conocimiento que ya es valor para la propia organización.
Hay innumerable información sobre big data. Estas son algunas recomendaciones.
Blog del Profesor de Sistemas de Información en IE Business Schol Enrique Dans: http://www.enriquedans.com/tag/big-data
Blog del Catedrático en la UPC Barcelona Tech Jordi Torres: http://www.jorditorres.org/category/big-data/
IBM: Smarter Computing
EMC: EMC Big Data
En Youtube podéis ver la conferencia: Vivir en un mar de datos
Francesc Máñez
Retail Technology Consultant
CEO de Qmax Consulting SL