¿Sabes de qué trata el Big Data?

¡En EICHE te enseñamos formas para tener tu propio negocio en internet!

Actualmente descubrir el beneficio real de los datos es una necesidad elemental de todas las empresas. Ya que requieren de una capacidad de analizar grandes cantidades de datos y sacar provecho de estos.

Es aquí donde juega un papel importante lo que se llama “Big Data”, ya que por medio de esta tendencia el avance de la tecnología ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, se pueden examinar y procesar enormes volúmenes de información.

Así como generar estrategias de negocio enfocadas en el cliente, tomar decisiones más acertadas y ser más competitivos en el mercado.

De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.

Dicho concepto engloba infraestructuras, tecnologías y servicios que han sido creados para dar solución al procesamiento de enormes conjuntos de datos estructurados, no estructurados o semi-estructurados (mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas, logs etc,) que pueden provenir de sensores, micrófonos, cámaras, escáneres médicos, imágenes entre otros.

Tipos de datos en Big Data
Hay varias categorías en las que se dividen estos datos, ya que como hemos explicado el Big Data es utilizado para describir enormes cantidades de ellos y tomaría demasiado tiempo y sería muy costoso cargarlos a una base de datos relacional para su análisis.

Dichas categorías son las siguientes:

Datos estructurados
Aquellos que tienen longitud y formato y que pueden ser almacenados en tablas (como las bases de datos relacionales). En esta categoría entran los que se compilan en los censos de población, los diferentes tipos de encuestas, los datos de transacciones bancarias, las compras en tiendas online, etc.

Datos no estructurados
Son los que carecen de un formato determinado y no pueden ser almacenados en una tabla. Pueden ser de tipo texto (los que generan los usuarios de foros, redes sociales, documentos de Word), y los de tipo no-texto (cualquier fichero de imagen, audio, vídeo).

Datos semiestructurados
Dentro de la categoría no estructurados, podemos añadir los que no pertenecen a bases de datos relacionales ya que no se limitan a campos determinados, aunque poseen organización interna o marcadores que facilita el tratamiento de sus elementos; estaríamos hablando de documentos XML, HTML o los datos almacenados en bases de datos NoSQL.

Por otra parte aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.