Big Data: de la teoría a la práctica > 1. ¿Qué es el Big Data?

Escrito por 11 agosto, 2015Tecnología
Definición de Big Data

Big Data es el término de moda en el mundo de la informática. Desde gigantes como Google o Facebook hasta las empresas más pequeñas, todas tienen en mayor o menor medida esta nueva tecnología/herramienta en mente para obtener beneficios calculables de sus datos almacenados.

En esta serie de posts se intentará explicar qué es Big Data, qué herramientas son las más utilizadas y se expondrá un caso práctico y real en la que el uso del Big Data ha reportado información extra de datos ya existentes.

¿Qué es el Big Data?

Big Data es un conjunto de datos que son demasiado grandes, demasiado complejos o que cambian con demasiada rapidez como para ser analizados con método manuales o tradicionales de procesamiento de datos. Actualmente el término Big Data está sujeto a cambios continuos, también se denomina a menudo como Big Data el complejo de tecnologías que se utilizan para la recolección y análisis de estos conjuntos de datos. Los datos recogidos pueden provenir de casi cualquier fuente: desde cualquier tipo de comunicación electrónica, pasando por datos almacenados por administraciones y llegando hasta registros de diferentes sistemas de monitoreo. Big Data por lo tanto puede cubrir áreas que antes se consideraban privadas. El deseo de la industria y de ciertas autoridades de tener el máximo acceso posible a estos datos, para  poder analizar mejor y utilizar los conocimientos adquiridos, entra cada vez más en conflicto con los derechos personales del individuo.

Definición

Al ser un término relativamente nuevo y en constante cambio Big Data puede encajar en distintas definiciones. Hay 3 aspectos que en mayor o menor medida aparecen en cada una de las definiciones existentes:

  • Volumen
  • Velocidad
  • Variedad

La definición más adecuada al tener en cuenta estos aspectos con los que se relaciona Big Data en la actualidad es la siguiente:

[blockquote_dd style=’style3′ quote_mark=’0′ delimiter=’ ‘]Big Data son datos que superan la capacidad de procesamiento de los sistemas de bases de datos convencionales. Los datos son demasiado grandes, se mueven demasiado rápido  o no se ajusta a las restricciones de las bases de datos tradicionales. Para poder analizar o evaluar estos datos se debe elegir un camino alternativo para procesarlos.[/blockquote_dd]

Big Data se ha hecho viable a medida que han ido surgiendo alternativas para controlar el volumen, la velocidad y la variabilidad de los datos masivos. Dentro de estos datos se encuentran informaciones y patrones que, de otro modo, permanecerían ocultos debido a la cantidad de trabajo necesario para extraerlos. Para las empresas líderes, como Microsoft o Google, esta capacidad lleva ya bastante tiempo a su alcance, aunque con un enorme coste. El hardware de productos domésticos actuales, el Cloud Computing y el software de código abierto han llevado el procesamiento y análisis de esta enorme cantidad de datos al alcance de organizaciones con menos recursos. Hoy en día, Big Data es factible para procesamiento de datos grandes y es eminentemente factible para las pequeñas startups, que disponen de poco dinero para el alquiler de recursos en la nube e incluso para particulares.

¿Qué valor tiene?

El valor de Big Data para una organización se divide en dos categorías: uso analítico y apoyo en la creación de nuevos productos. El análisis de Big Data puede revelar información previamente oculta por el alto coste de procesar los datos como, por ejemplo, la presión de grupo entre los clientes, revelada por el análisis de las transacciones de los compradores y de los datos sociales y geográficos. Ser capaz de procesar cada elemento en un tiempo razonable elimina la problemática de realizar un muestreo y promueve un enfoque de investigación enfocado a los datos, en contraste con la naturaleza estática de ejecutar informes predeterminados.

Algunas startups de éxito de la última década son los principales ejemplos del uso de Big Data como un facilitador de nuevos productos y servicios. Por ejemplo Facebook ha sido capaz de diseñar una experiencia de usuario altamente personalizada y crear un nuevo tipo de negocio de la publicidad mediante la combinación de un gran número de señales de las acciones del usuario y las de sus contactos. No es ninguna coincidencia que la mayor parte de las ideas y herramientas que sustentan Big Data hayan surgido de Google, Yahoo, Amazon o Facebook.

La aparición del Big Data en la empresa trae consigo una contrapartida necesaria: la agilidad. Explotar con éxito el potencial de los datos requiere de experimentación y exploración. Ya sea a la hora la crear nuevos productos o en la búsqueda de maneras de obtener una ventaja competitiva, el trabajo requiere la curiosidad y una perspectiva empresarial.

Como término general, Big Data puede ser bastante impreciso, de la misma manera que el término «nube» abarca diversas tecnologías. Los datos de entrada a los sistemas de Big Data pueden ser chats de redes sociales, registros de servidores, sensores de flujo de tráfico, imágenes de satélite, reproducciones de audio, transacciones bancarias, archivos MP3, contenido de las páginas web, imágenes escaneadas de los documentos del gobierno, rutas GPS, telemetría de automóviles, datos del mercado financiero y así un sin fin de fuentes.

Para aclarar las cosas se suele utilizar los tres aspectos, ya nombrados con anterioridad, de volumen, velocidad y variedad. Son un cristal útil a través del cual observar y comprender la naturaleza de los datos y las plataformas de software disponibles para explotarlos.

En el próximo post se analizarán los tres aspectos que definen Big Data: volumen, velocidad y variedad.

Join the discussion 2 comentarios

Dejar un comentario

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies.

ACEPTAR
Aviso de cookies