Big data: Todo lo que necesita saber 

Categorías: Tecnología
big-data

Big Data, macrodatos, datos masivos o inteligencia de datos. Existen múltiples formas para referirse a este concepto característico de la industria 4.0, cuyo desarrollo en los últimos años ha trascendido del campo tecnológico para acaparar la atención de múltiples sectores económicos. 

 

Sin embargo, todavía existen muchas empresas, organizaciones e instituciones públicas y privadas que se muestran reticentes a la hora de abandonar los métodos tradicionales de análisis, e incorporar el Big Data y los métodos avanzados de estadística y aprendizaje automático en sus procesos de toma de decisiones. 

 

Existe un mar de datos ahí fuera por explotar y es responsabilidad de las empresas el saber aprovecharlo, con el objetivo de poder prevalecer en el mercado. Por este motivo, a continuación, analizamos la importancia actual de los datos masivos, sus diferentes acepciones, tipologías y usos en el mundo empresarial. 

 

¿Quiere centralizar toda la información de su organización, para facilitar la toma de decisiones e incrementar los niveles de eficiencia operativa? Clic aquí y solicite una demo gratuita de AuraQuantic.

 

 

La importancia de los datos masivos 

Los datos no son un invento nuevo del presente siglo. Desde hace muchas décadas atrás su recopilación, organización, almacenamiento y análisis, a partir del uso ordenadores y bases de datos ha servido para registrar acciones y simplificar procesos.  Todo ello, de una forma accesible y sencilla, a golpe de clic, de la que se han beneficiado empresas, instituciones y organismos mundiales.

 

Sin embargo, el inicio de la web junto al uso masivo de internet y su evolución por medio del Internet de los Objetos (IoT) han propiciado que sobre el mundo físico se desarrolle un nuevo ecosistema digital, en el que los datos ocupan un papel decisivo a la hora de predecir comportamientos y anticiparse a las necesidades de los clientes. A ello hay que sumar los avances en almacenamiento y análisis de datos desarrollados hasta la fecha, los cuales, han hecho posible que se puedan capturar, guardar y trabajar con múltiples tipos de datos.

 

Hoy en día, el Big Data va más allá del rastro o huella que cada usuario deja a su paso tras utilizar un buscador web o el tipo de seguidores o “me gusta” registrados en sus diferentes perfiles de redes sociales. Google sabe qué anuncios de productos o servicios mostrar a cada usuario, en función de sus gustos, preferencias o intereses. El gigante de la moda online, Zalando, ofrece recomendaciones de productos en función del historial de compras de cada cliente. IKEA solicita el código postal a todos aquellos que realizan una compra en cualquiera de sus establecimientos como parte de su estrategia comercial, permitiéndoles cruzar las ventas de productos con las ubicaciones de clientes para conocer qué productos se venden más en un área geográfica determinada. A nivel político, durante la campaña a las elecciones presidenciales de EE. UU., en 2012, el director de campaña de Barack Obama, Jim Messina, creó un proyecto basado en técnicas de minería de datos y microtargeting aplicadas a la comunicación política, con la intención de lograr la reelección del presidente. Esto fue posible gracias a la creación de una gigantesca base de datos que el equipo de analistas de Obama había obtenido tras la campaña de 2008 y cuyos datos cruzaron, depuraron y estructuraron a fondo. Dicha base de datos incluía información proporcionada por donantes del partido, encuestadores, voluntarios y archivos varios del Partido Demócrata, así como datos recogidos a través de las redes sociales. Todos ellos, sirvieron para obtener referencias personales de potenciales votantes que iban desde los datos más básicos como la edad, el sexo o el lugar de residencia, hasta otros más complejos como su nivel de ingresos, inclinación política, grado de implicación electoral, perfil de consumo, preferencias o círculo de relaciones personales, entre otros. 

 

Todos estos casos de uso de macrodatos son solo una pequeña muestra del valor que la recopilación, almacenamiento y análisis de datos puede llegar a tener para cualquier organización, sin importar su ámbito económico o tamaño. Unos datos, cuyos principales usos empresariales podemos catalogar en base a diferentes criterios, como veremos más adelante. 

 

Definición de Big Data 

El concepto de Big Data es acuñado por primera en el año 1997, en un artículo publicado por los investigadores de la NASA, Michael Cox y David Ellsworth, titulado Application-Controlled Demand Paging for Out-of-Core Visualization. La publicación aborda cómo en el ámbito de la visualización científica, consistente en la transformación de datos científicos y abstractos en imágenes, “los conjuntos de datos de entrada suelen ser muy grandes y se espera que estos aumenten con la capacidad de los superordenadores para generarlos”. Asimismo, subraya el artículo “la visualización de los datos supone un reto interesante para los sistemas informáticos: los conjuntos de datos suelen ser bastante grandes y ponen a prueba la capacidad de la memoria principal, el disco duro e, incluso, el disco remoto. A esto lo llamamos el problema del Big Data”.  

 

Posteriormente, diferentes empresas, firmas consultoras y organizaciones se han referido al término “Big Data” de múltiples formas. El McKinsey Global Institute, perteneciente a la consultora estratégica global McKinsey & Company, lo utilizó por primera vez en su informe Big Data: The next frontier for innovation, competition and productivity (2011). Este documento señala como «la cantidad de datos en nuestro mundo se ha disparado». Además, destaca cómo «el análisis de grandes conjuntos de datos se convertirá en un aspecto fundamental para la competencia, sustentando nuevas oleadas de crecimiento de la productividad, innovación y excedente del consumidor”.  

 

Poco tiempo después, Gartner publicó Hype Cycle for Big Data (2012), donde analiza el ciclo de vida del Big Data, con la finalidad de ayudar a las empresas a desarrollar estrategias basadas en conjuntos de datos cada vez más voluminosos, rápidos y variados. Así es como Gartner se refiere al Big Data, es decir, “activos de información de gran volumen, alta velocidad y/o alta variedad que exigen formas rentables e innovadoras de procesamiento de la información destinadas a mejorar la visión, la toma de decisiones y la automatización de los procesos”.  

 

Por su parte, Forrester en su informe The Big Deal about Big Data for Customer Engagement (2012) subraya que “para mejorar el compromiso de los clientes, las empresas debían invertir en soluciones para gestionar el Big Data”. Un término que Forrester define como “las prácticas y la tecnología que cierran la brecha entre los datos disponibles y la capacidad de convertirlos en conocimiento empresarial”.  

 

Todas estas referencias demuestran que, aunque no existe un pleno consenso a la hora de establecer una definición sobre los datos masivos, unos hablan de datos y otros de tecnologías para convertir esos datos en información de valor, de lo que no cabe la menor duda es del poder que confieren a las organizaciones, por medio de sus características: volumen, velocidad, variedad, veracidad y el valor de los datos. Todas ellas agrupadas bajo la denominación de las cinco V’s del Big Data.

 

 

Tipos de Big Data: 

Dentro del Big Data podemos distinguir tres categorías de datos diferentes. Los estructurados que se encuentran en bases de datos tradicionales; los no estructurados como imágenes, vídeos y correos electrónicos; y, finalmente, los semiestructurados que están a medio camino entre las dos tipologías anteriores. 

 

Estructurados: Son aquellos que tienen una estructura predefinida y fija. Su almacenamiento se lleva a cabo en campos de tablas de bases de datos relacionales, donde su longitud, denominación y formato han sido predefinidos. Esto permite conocer de forma anticipada su organización, estructura, tipo, posiciones y posibles relaciones entre ellos. Ejemplos: Tablas de Excel, hojas de cálculo, fichas estandarizadas de clientes, encuestas a usuarios sobre un producto o servicio, etc. 

 

No estructurados: En esta categoría se encuentran aquellos datos que no disponen de una estructura predefinida, ni están almacenados en una tabla. Ejemplos: Vídeos, audios, imágenes, archivos PDF, archivos de texto, documentos, presentaciones visuales, correos electrónicos, etc. 

 

Semiestructurados o híbridos: Están a medio camino entre los datos estructurados y los no estructurados, ya que, contienen propiedades de ambas categorías. Aunque no tienen un formato fijo, se organizan mediante etiquetas y otros marcadores para identificar algunos de sus elementos. Este tipo de datos los encontramos en archivos de texto creados con lenguajes HTML, XML o JSON. Ejemplos: Los registros Web logs de las conexiones a internet y las bases de datos NoSQL. 

 

 

tipos-big-data

 

 

Principales usos del Big Data en el mundo empresarial 

El uso de los datos masivos agrega un gran valor en dimensiones estratégicas como la eficiencia operativa, monetización de los datos y toma de decisiones. Sin embargo, la experiencia del cliente y la apertura hacia nuevos modelos de negocio constituyen otras de las áreas donde el uso de los datos masivos puede reportar importantes beneficios empresariales, como: 

 

  • Eficiencia operativa: El Big Data constituye una herramienta esencial a la hora de incrementar el nivel de productividad y optimizar los recursos disponibles, para lograr la máxima rentabilidad. El uso y análisis inteligente de los datos no solo permite aumentar la transparencia, optimizar el consumo de recursos y mejorar la calidad en el rendimiento de los procesos, también, ayuda a detectar posibles desviaciones, anomalías y cuellos de botella que los métodos convencionales no son capaces de diagnosticar.

 

  • Monetización de los datos: La conversión de los datos en dinero es posible gracias a, por ejemplo, la unión entre el Big Data y el IoT. La incorporación de sensores en objetos tradicionalmente pasivos como wearables, automóviles, bombillas, electrodomésticos, etc., ha servido para dotarlos de capacidades inteligentes.  Ahora estos objetos, pueden recopilar datos para su envío a centros de procesamiento, gracias a una estructura de red interconectada que, también, permite su comunicación entre sí con la capacidad de transmitir, compilar y analizar datos. De forma más simplificada, el IoT es un tipo de tecnología basada en la conexión de objetos cotidianos a Internet que agregan, intercambian y procesan información sobre su entorno físico, con la finalidad de proporcionar servicios de valor añadido a los usuarios finales. Toda esta gran cantidad de datos capturada puede ser reutilizada posteriormente por las empresas, para mejorar la experiencia del cliente ofreciendo servicios, mejoras y actualizaciones más personalizadas. Asimismo, la aplicación de sensores en máquinas y objetos en entornos industriales, más conocido como el Internet Industrial de las Cosas (IIoT), ayuda a identificar fallas en cualquier etapa de los flujos productivos, permite anticiparse a posibles eventualidades que comprometan el funcionamiento de los sistemas y equipos de producción, y contribuye a tener un control constante y en tiempo real de los factores críticos de calidad que afectan a la línea de producción.

 

  • Toma de decisiones: La recopilación de datos procedentes de los clientes ayuda a las empresas a mejorar el proceso de toma de decisiones estratégicas en todas las fases, desde el diseño, fabricación y distribución, hasta la venta y servicio postventa. El objetivo es anticiparse a las tendencias del mercado y a las necesidades de los clientes, para ofrecer productos y servicios con un elevado nivel de personalización. Dentro de este punto se encuentran el análisis de hábitos de compra y consumo, el estudio de pautas de comportamiento social a nivel masivo y el diseño de modelos predictivos asociados con la conducta de diferentes perfiles de clientes (consumidores, votantes, etc.).

 

  • Experiencia cliente: Monitorizar las experiencias de los clientes, a través de cualquier canal de contacto, predecir gustos y preferencias, y descubrir tendencias que permitan detectar posibles variaciones en las preferencias de los diferentes segmentos de clientes son algunos ejemplos de cómo los datos pueden ser utilizados para mejorar la experiencia del consumidor.

 

  • Nuevos modelos de negocio: La recopilación de datos y su posterior análisis puede ser utilizado tanto para expandir flujos de ingresos de productos existentes, como para crear flujos de ingresos adicionales a partir de nuevos productos y servicios. Hoy en día, vemos como empresas que tradicionalmente siempre han estado asociadas con un sector se están abriendo paso haciendo otros nuevos. Orange es un claro ejemplo de cómo una empresa afincada en el sector de las telecomunicaciones puede dar el salto hacia el mundo financiero, con su propuesta Orange Bank. Otro ejemplo lo encontramos en el líder del comercio electrónico Amazon, el cual se ha abierto paso en el sector tecnológico por medio de su servicio en la nube, Amazon Web Services (AWS).

 

big-data