Generalmente, cuando se habla de Internet of Things (IoT) se tiende a pensar en tecnologías Big Data donde enormes volúmenes de datos medidos en petabytes son almacenados y analizados para sacar tendencias y pautas. Lo que mucha gente no se da cuenta es que muchos casos relacionados con IoT tan solo requieren volúmenes de datos pequeños. ¿Qué se consideran “datos pequeños” o Small Data?
1. ¿Qué es Small Data?
Small Data son datos que por su volumen y formato son fácilmente accesibles y manejables y que de por sí, sin tratamiento, ya nos dan una información concreta. Es decir, small data nos provee con información que responde a una pregunta concreta o trata de un problema específico.
Ejemplos de Small Data podrían ser resultados de una jornada de fútbol, reportes de inventario o datos de ventas en una PYME, historiales de búsqueda, previsiones meteorológicas, etc.
2. Small Data VS Big Data
El concepto Small Data contrasta con el de Big Data, que por lo general se refiere a una combinación de datos estructurados y no-estructurados que son medidos en petabytes o exabytes. Como dijimos en un artículo anterior, Big Data se caracteriza por las 3 Vs: Volumen de datos, variedad de datos y velocidad a la que son (o deberían ser) procesados.
Estos 3 puntos hacen que el Big Data sea muy complicado de gestionar. Por el contrario, el Small Data se compone de secciones de datos fácilmente manejables.
3. Small Data Group
Small Data Group es un grupo dedicado a la investigación de todos los aspectos relacionados con Small Data. Su fundador es Allen Blonde, vicepresidente de Actuate Product Marketing and Innovation.
Respecto a Small Data, nos da la siguiente explicación:
“Small Data conecta a personas con datos recientes y concretos que ya poseen un significado intrínseco y que están organizados y estructurados para ser fácilmente accesibles, entendibles y manejables para el día a día. Estos datos pueden derivar de volúmenes de datos más grandes (Big Data) o de fuentes locales.”
4. Small Data: Ejemplos de uso
Small Data: Ejemplo de uso 1
Una turbina eólica contiene varios sensores para determinar la dirección y velocidad del viento, temperatura, vibración y otros atributos de interés. Las hélices de la turbina pueden ser programadas para recalibrarse automáticamente ante condiciones cambiantes del viento en función de la información alimentada al instante a través de Small Data.
Estos volúmenes de Small Data (i.e. una batería de Small Data por turbina) son incorporados un pool de datos de mayor volumen (Big Data) donde algoritmos de procesamiento de datos permiten descubrir tendencias y pautas de comportamiento. Estas pautas pueden revelar información de rendimiento de ciertos mecanismos en base a su histórico de mantenimientos. Por ejemplo, cómo el viento y las condiciones meteorológicas afectan al desgaste de los componentes de las turbinas, y de esto último poder desagregar la información para conocer el tiempo de vida útil de una pieza concreta de la turbina.
Small Data: Ejemplo de uso 2
Otro caso, es el uso de etiquetas inteligentes en frascos de medicinas. Small Data puede ser usado para determinar la ubicación del frasco, el estado del sello de la botella, las condiciones de temperatura y humedad de la ubicación del frasco.
Agregando las secciones de Small Data a un volumen de Big Data se pueden ejecutar algoritmos de análisis para, por ejemplo, determinar la raíz de la causa por la que una medicina se ha deteriorado o caducado: ¿Es ello debido a una compañía de transporte o a un comercializador? ¿Son problemas recurrentes que apuntan a un fallo en la cadena de suministro?
Resolver problemas como los de arriba puede suponer un ahorro enorme a compañías e instituciones. Recordemos: Small Data permite saber qué hace el objeto que está siendo analizado. Si lo que quieres es saber por qué el objeto está haciendo eso, Big Data es lo que necesitas.