Por

¿Qué es el Big Data?

Big Data” es una frase que ha saltado directamente del cuarto de computación de alto rendimiento de algún oscuro departamento de IT hacia los hashtags de Twitter. Desde entonces es una frase que encontramos habitualmente en ponencias y presentaciones de proveedores de virtualización de procesamiento y almacenamiento… pero ¿qué significa exactamente?

Según Wikipedia, Big Data se refiere a conjuntos de datos que crecen tan rápidamente que no pueden ser manipulados por las herramientas de gestión de bases de datos tradicionales. Sin embargo, el tamaño no es el único problema al que nos enfrentamos si buscamos una solución: además de almacenarlo, es necesario capturar, consultar, gestionar y analizar toda esta información.

Al margen del análisis de tendencias de negocio, los científicos se encuentran regularmente con problemas generados por el almacenamiento y procesamiento de Big Data en la investigación biológica, simulaciones físicas complejas, meteorología…

Sin irnos a estos extremos, no son pocas las grandes compañías que tendrán que enfrentarse a este problema a corto plazo sin necesidad de contar con especialistas en análisis biológico entre sus filas, o incluso sin nisiquiera proponerse explotar información para obtener una ventaja competitiva. Por ejemplo, para muchas compañías es necesario mantener a lo largo de tiempo, ya sea por imposición legal o por pura operatividad, un gran número de datos estructurados y no estructurados: grandes masas de documentos, emails, y otras formas de comunicación electrónica que es necesario almacenar o consultar y que no hacen otra cosa que crecer de forma exponencial.

Sin embargo, el concepto de Big Data se extiende más allá de lo que estamos acostumbrados a entender por “grandes volumenes de información”. Siempre que hagamos una búsqueda, enviemos un email, usemos un teléfono móvil, actualicemos una red social, usemos una tarjeta de crédito, vayamos al gimnasio, activemos el GPS, demos parte a casino online un seguro o hagamos la compra en el supermercado dejamos detrás de nosotros una montaña de datos, huellas digitales y registros que ofrecen una información muy valiosa y cuyo estudio es la ambición de todo analista. La enorme cantidad de datos que generan empresas, usuarios y dispositivos, ha experimentado un crecimiento explosivo que requiere su análisis para obtener ventajas competitivas. El Big Data se está convirtiendo en el punto de inflexión de las empresas que consiguen “dominarlo”, empresas que se han dado cuenta que la manera de obtener ventaja es tener la capacidad de procesar uno de sus principales activos: la información que la propia empresa genera.

Sin embargo no sería correcto olvidar otros retos, al margen de los tecnológicos, que nos encontraremos al llevar a cabo esta tarea. En primer lugar, los datos por sí mismos son incapaces de producir un beneficio. Solo los humanos que sepan explotarlos podrán hacerlo. Es por esto que además de la tecnología necesaria para mover tal volumen de datos, es necesario afinal al máximo las metodologías y procesos que se utilizan para acceder y explotar esta información. Por otro lado, privacidad. ¿Como se podrían garantizar los derechos fundamentales de privacidad de los usuarios ante un escenario así? ¿Serán aún aplicables o técnicamente viables algunos requisitos legales como el derecho de acceso en unos años?

Para concluir, os dejo una ya manida reflexión de Eric Schmidt (ex CEO de Google) que nos da idea de la magnitud de la información que estamos comentando: “entre el nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada. Actualmente creamos cinco exabytes cada dos días“.

Hipervínculo
One Response to ¿Qué es el Big Data?

Deja un comentario

Tu dirección de correo no se mostrará. Por favor introduce tu nombre, email y comentario.

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>