En la actualidad es común escuchar que la mayoría de empresas en el mundo hablan acerca de Big Data y lo contemplan como una solución de muchos de sus requerimientos tecnológicos, pero en verdad las empresas ¿saben que es Big Data?
Se han analizado algunos conceptos teóricos del Big Data y por qué es considerado como una revolución, se parte de un concepto inicial de Big Data a partir de las llamadas 3 Vs.
En donde Volumen hace referencia a ¿qué tan grandes son los datos?, y siempre va a depender de ¿quién lo ve?, ya que en términos de volumen de datos el tamaño esta directamente relacionado con la capacidad de procesamiento de estos, por tal razón puede que para Hamburguesas El Corral 1 terabyte sea una cantidad enorme de datos, pero para una empresa como Ecopetrol sea una cantidad relativamente pequeña. Cuando se habla de Velocidad en Big Data hace referencia a grandes volúmenes de datos entrando todo el tiempo, es decir se esta contemplando una frecuencia de entrada de datos, ¿cuantos datos se están procesando en un periodo de tiempo determinado?. La Variedad esta relacionada con el tipo de dato, como se está hablando de Big Data se van a tener en cuenta datos que antes no se contemplaban, un dato estructurado es un dato de fácil procesamiento, es un dato tradicional por ejemplo archivos de Excel, bases de datos SQL, entre otros, ahora un dato no estructurado es un dato que requiere un trabajo extra para poder ser procesado, es un dato que se tiene que organizar para poder extraer información por ejemplo una imagen, un vídeo, un audio, entre otros. Entonces si se está trabajando con volúmenes, tipos y velocidades de datos que antes no se contemplaban, pues se van a empezar a observar y descubrir cosas que antes no se veían.
Pero ¿por qué se está hablando de una revolución?
Toda revolución está ligada a un cambio, el Big Data plantea dicho cambio en referencia a que a partir de un cambio Cuantitativo basado en el volumen, tipo y velocidad de información que se puede procesar conlleva a un cambio Cualitativo es decir, como se tiene la capacidad de procesar información de todo tipo se pueden descubrir y analizar cosas que antes nunca se habrían descubierto, lo que permite descubrir nuevas interacciones, nuevos comportamientos de los usuarios y sobre todo nuevas oportunidades de generar valor, lo que hoy en día hacen empresas como Google , Amazon o Facebook que saben cuales son los lugares que mas frecuentan las personas y por ende saben a dónde posiblemente quieren ir, o que probablemente quieren comprar y sacan una promoción en el momento exacto, ellos están generando valor a su negocio a través de Big Data.
La revolución de los datos masivos – Big Data consiste en realizar predicciones basadas en estudios descriptivos previos, en donde la finalidad se enfoca en como a partir de matemática y estadística aplicada a grandes volúmenes de datos se pueden inferir probabilidades de múltiples cosas, por ejemplo, la probabilidad de que un préstamo le sea aprobado a una persona con ciertas características o la probabilidad de que una pareja tenga una primera cita exitosa en un portal de encuentros. El cambio cualitativo en donde se descubren cosas nuevas, se encuentran nuevas formas de generar valor, nuevos modelos de negocio, se enfoca en dar importancia a los datos mismos o dicho de otra manera hay que “dejar que los datos hablen” es decir hay que tener claro que el Big Data no se centra en las maquinas que contienen los datos, se enfoca en los datos en si y como son usados, como se les puede sacar el mayor provecho.
Tres cambios en la forma de analizar la información.
Sin lugar a duda los datos masivos – Big Data serán una fuente de innovación y de nuevo valor económico, hay que plantearse algunos cambios en la manera de cómo se analiza la información ya que si bien se están contemplando volúmenes y tipos de datos que antes no se contemplaban la manera de analizar los datos debe tener un cambio.
Muestreo como atadura. Se pueden analizar más datos en este mundo y en algunos casos se pueden procesar todos los relacionados con un determinado fenómeno. Este cambio esta relacionado con la necesidad de Muestreo que se realizaba y se realiza en el análisis de la información lo cual infiere a un síntoma de escasez de datos y en la mayoría de los casos es muy normal realizar dicho proceso ya que no se contemplaba el muestreo como una atadura artificial, pues bien, como en un proyecto de Big Data se contempla la información como un todo permite apreciar detalles que nunca se pudieron ver cuando se estaba limitado a cantidades mas pequeñas, los datos masivos – Big Data tienen la particularidad que permite tener una vista alejada de lo granular es decir se pueden contemplar subcategorías o submercados que las muestras sencillamente no pueden estimar.
Menos errores de muestreo se pueden asumir mas errores de medida. Cuando se tiene una capacidad de medición limitada solo es posible contar las cosas mas importantes, es decir se necesita un esfuerzo mucho mas grande para obtener un resultado exacto, hasta hace poco la mayor parte de herramientas digitales partían de la premisa de la exactitud pero dicha forma de pensar resultaba de un entorno de datos escasos, ya que se tenían pocas cosas que medir se tenia que centrar en que las mediciones fueran exactas, al llegar en la noche a una tienda pequeña se puede contar el dinero de las ventas hasta el último céntimo, pero no se haría lo mismo de hecho no se puede hacer lo mismo con el PIB de un país, a medida que la escala crece, el número de errores también lo hace, por ende en el mundo de los datos masivos se puede dejar de lado solo una parte de la rígida exactitud, no es que se vaya a dejar de contemplar la exactitud solo no se va a contemplar como un todo, lo que se pierde en exactitud a un nivel micro se gana en percepción a un nivel macro.
Alejamiento de la búsqueda de la causalidad. En el mundo de los datos masivos no es necesario concentrarse en la causa de las cosas por el contrario se puede descubrir pautas o correlaciones en los datos que ofrezcan nuevas perspectivas que no se aprecian fácilmente, puede que dichas correlaciones no den la respuesta al por qué está ocurriendo algo, pero alerta o hace un llamado de que algo esta pasando. En números situaciones el qué de las cosas es suficiente por ejemplo si millones de registros médicos revelan que la combinación de aspirina y jugo de naranja disminuyen la probabilidad de contagiarse por un determinado virus, la causa exacta del no contagio puede ser menos importante que el hecho de que menos personas lo adquieren. Los datos masivos se enfocan en el qué y no en el por qué, no siempre se necesita conocer la causa del fenómeno simplemente se puede dar paso a que los datos hablen por si solos.
¿Le estas sacando el mayor provecho a tus datos?, en la actualidad es necesario dejar de ser una empresa reactiva para convertirse en empresa predictiva, es necesario entrar en la revolución de los datos masivos – Big Data en donde se tengan empresas que dejen de pensar en por qué ayer fue el día que menos se vendió y se empiece a pensar en cual es la probabilidad de que esos registros de ventas se vuelvan a presentar.
¡Es hora de estar dentro de la revolución de los datos masivos – Big Data!