¿Qué es Big Data?

big-data

Big Data se usa actualmente para nombrar la acumulación y análisis de grandes cantidades de datos. También conocido como “datos a gran escala”, el término Big Data comenzó a surgir en los años 90 cuando John Mashey publicó un artículo titulado Big Data and the Next Wave of Infrastress en el cual, Mashey hacía referencia a cómo iba a cambiar la infraestructura física y humana debido a la gran cantidad de datos que se veía venir, y que era imposible de manejar con los instrumentos de gestión de uso de esa época.

La idea detrás del Big Data es que gracias al avance de la tecnología, existe un nuevo enfoque de entendimiento y toma de decisiones, los cuales son utilizados para describir enormes cantidades de datos que tomaría demasiado tiempo y sería demasiado caro cargarlos en una base “normal” o “relacional” para su análisis. En estas bases gigantes y complicadas, entra el Big Data en todo su esplendor y agrupa toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.

Big Data no se refiere a una cantidad específica y utiliza el lenguaje de petabytes y exabytes de datos. En términos de bytes estas serían las medidas:

Gigabyte = 109 = 1,000,000,000
Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000

Más allá del volumen de información, los datos pueden ser recopilados de varias fuentes y aplicados a varias disciplinas. Así, se pueden obtener de dispositivos móviles, sistemas GPS; sensores, equipos industriales, automóviles, etc; los cuales pueden medir la temperatura, humedad, cambios químicos, ubicación, posición, etc. Analizar estos datos requiere que la velocidad de respuesta sea lo suficientemente rápida para obtener información en el momento preciso, siendo el uso del Big Data más que relevante en estos casos. Gracias al análisis de esta minería de datos, podemos descubrir patrones de comportamiento y lograr predicciones, basada en la información que nos dan estos grandes volúmenes de conjuntos de datos.

Existe mucha información sobre análisis, presentación, tipos de datos y fuente de estos. La información puede ser generada por las personas cuando envían correos electrónicos, mensajes en whatsapp o publicaciones en redes sociales. También existen las transacciones de dinero o cualquier actividad financiera que realicemos, datos generados por internet, datos generados por máquinas a otras máquinas (M2M) al enviar información a través de sensores sobre temperatura, luz o sonido entre otros. Finalmente se encuentran los biométricos, los cuales provienen de los datos de seguridad, defensa y servicios de inteligencia. Esta información es constante y enorme por lo que el Big Data interviene para el análisis respectivo.

Aquí les dejo un esquema que realizó IBM para clasificar de donde provienen los tipos de datos del Big Data

Big-Data-Tipos

El análisis de estos datos es muy útil para diversas industrias, desde el punto de vista empresarial cuando se analizan las redes sociales de estas y las grandes bases generadas por las ventas cruzadas de la misma compañía; o la información que generan sus propios trabajadores. En deporte cuando se analizan las estadísticas de los partidos de fútbol, las cuales son relevantes a la hora de toma de decisiones para los entrenadores. También se puede aplicar en medicina para investigar el comportamiento de una pandemia y ser capaz de predecir la actividad de la enfermedad en cuestión. O en el caso de seguridad para plantear sistemas de defensa a diversos tipos de ataques desde informáticos hasta de guerra.

Como ven, el Big Data es impresionante y ayuda a la gente (especialmente a los investigadores) a descubrir cosas que les podrían haber tomado años en descubrir por si mismos sin el uso de estas herramientas, debido a la velocidad del análisis. Además con el auge del Internet de las cosas, estoy segura, de que el Big Data será aún más importante en los próximos años.

C.

Google lanza Consumer Surveys para México

google-logo

Hace un tiempo escribí sobre la importancia de los insights en la publicidad y cómo también la investigación jugaba un papel importante en la elaboración de estos. Pero la investigación del comportamiento del consumidor va más allá de la publicidad: Nos permite predecir comportamientos, hacer estudios exhaustivo sobre temas sociales, económicos, entre otros; o desarrollar productos que satisfagan un mayor rango de necesidades en la pirámide de Maslow.

Así han nacido diversas compañías han lanzado productos que nos ayudan con esta investigación del consumidor: Ipsos, Kantar, Comscore, etc. Google también está metido en el meollo desde hace un tiempo y por fin está disponible en México Google Consumer Surveys, el servicio de estudios de mercado, análisis y encuestas de la compañía. Según Paul McDonald, Group Product Manager de Google Consumer Surveys, la idea es traer herramientas y servicios de investigación de mercado y publicidad de alta calidad a un precio asequible para las empresas.

Consumer Surveys ayuda a los usuarios y empresas a medir los resultados de sus campañas de publicidad a través de encuestas y estudios de mercado. Así, por ejemplo en el caso de un lanzamiento, una empresa puede usar esta herramienta para ver que piensa el público de su producto en diversas categorías que van desde el logo, edades, satisfacción, entre otros. Los negocios podrán crear encuestas en pocos minutos y tener resultados en horas. Asimismo, pueden seleccionar las características específicas que quieren que tenga el segmento al que se va a dirigir la encuesta para tener resultados significativos.

También para los creadores de contenido (Como esta humilde bloguera, aunque este producto va más dirigido para empresas grandes como Reforma o Excelsior) podrán usar esta herramienta pero como publicidad, ya que podrán colocar la encuesta en su sitio web y recibir un pago por cada respuesta obtenida.

Finalmente, Google señaló que con esta herramienta la idea es que los usuarios puedan acceder a contenido con una mejor calidad y que los editores tengan una opción adicional para generar dinero con este contenido.

C.

¿Qué es el Internet de las cosas?

internet-de-las-cosasInternet de las cosas (IoT por sus siglas en inglés) es un concepto muy actual en el mundo donde vivimos. La idea es que todos los objetos se conectan entre ellos y con Internet para ofrecer información en tiempo real. Hoy en día hay muchas cosas se conectan a Internet desde smartphones, tablets, laptops, televisores e incluso autos. Si vamos un poco más allá, el deporte es un gran ejemplo de Internet de las cosas. Así, un caso interesante es el de la empresa Zepp Labs, que actualmente está enfocada en crear sensores minúsculos alojados en balones, instrumentos o ropa de jugadores para poder recaudar datos, estadísticas e información que este tipo de dispositivo pueda brindar. Asimismo, Nike+ Running, Runkeeper, Sportstracker, entre otras aplicaciones populares entre los corredores, también impulsan el ioT al darnos información sobre la distancia, calorías, velocidad, ritmo cardíaco, distancia recorrida, fotos, etc. Todo alojado en la nube.

El concepto de Internet de las cosas fue propuesto por Kevin Ashton del Instituto de Tecnología de Massachusetts (MIT) en 1999. En un mundo ideal, cada objeto estaría conectado a Internet y tendría una IP específica con dispositivos de identificación y sabríamos exactamente la ubicación, rendimiento, si está prendido o apagado,  estadísticas de uso y toda la información que podamos obtener. Además podríamos darle instrucciones para que realice diversas acciones, como decirle a nuestra cafetera que comience a moler el café a cierta hora y así sucesivamente. Se calcula que en 2020, entre 22,000 y 50,000 millones de dispositivos se conectarán a Internet con el fin de proporcionar a los usuarios una serie de servicios y aplicaciones inteligentes sin precedentes.

El Internet de las cosas presenta retos culturales y tecnológicos. Llega para quedarse y cambiar los procesos no solo de las empresas como tal a la hora de automatizar los sistemas de producción, también en nuestra vida cotidiana. Uno de los grandes retos que trae este sistema es el tema de la seguridad. Dada la infraestructura que trae este tipo de tecnología puede ser vulnerable a robo de datos tanto personales como industriales, virus u otros ataques. Lo importante es crear las herramientas de protección necesarias como el cifrado de datos, mejores medidas de autenticación de los usuarios,  IPS estandarizadas y probadas para garantizar la seguridad de los usuarios ante estos nuevos cambios, una tarea difícil más no imposible.

C.