Digital

El público puede ser la mejor herramienta de análisis de datos online

Internet seguirá siendo una fuente de datos enorme en los próximos años y, gracias a los dispositivos móviles, se abren nuevos medios para obtener esta información. Sólo el tráfico móvil superará los 2 exabytes mensuales en 2013, hay más de 90 millones de tweets diarios y 60.000 millones de imágenes en Facebook, informa Mashable.

Pero hay mucho más, ya que ha nacido una nueva “ciencia” de estos datos y nuevas herramientas adaptadas al tamaño y la velocidad de la información de hoy en día. Entre las herramientas y técnicas que han nacido para lidiar con la monstruosa cantidad de datos que se generan se encuentran Hadoop, Hbase, MongoDB, Cassandra, R, Pig, Hive o NodeJS. Aunque la cantidad de herramientas y la demanda de éstas ha excedido notablemente el número de científicos capaces de llevar a cabo este trabajo.

Además, estos datos ya no sólo tratan de social media, y de cómo Twitter, Facebook y otras redes sociales han sido capaces de explotar los comportamientos y las preferencias de sus usuarios. Ahora, las finanzas, los bienes de consumo, los anunciantes y los gobiernos están decantándose por estas nuevas estrategias y técnicas para adaptarse a las nuevas demandas.

El crecimiento de la demanda y la carencia de expertos con experiencia en esta nueva metodología han provocado que se democratice el acceso a los datos, y algunas iniciativas como Datameer y Factual han puesto a disposición de los usuarios interfaces en las que poder jugar con esta información, algo a lo que también se han sumado gigantes de la red como Google.

Pero esta emergencia imparable de información también crea nuevos retos, ya que hay que tener un registro de las permutaciones que se crean, la cantidad de bits necesarios para que un dato sea válido y, sobretodo, cómo se sale del simple recuento de datos para poder llegar a responder preguntas pertinentes para los negocios.

La comunidad tecnológica ha sido capaz de crear datos provenientes del público, convirtiendo la recogida de datos en una iniciativa social, pero más allá de eso, hay pocos esfuerzos para motivar a la comunidad online para que analice los datos que se están generando.

Una forma de conseguir que estas presentaciones de datos y grandes cantidades de cifras cobren algún sentido y puedan ser analizadas tiene mucho que ver con el análisis conjunto de datos. Un usuario examina y extrae los datos sobre una materia en concreto y crea sus gráficos. Una vez lo publica en su blog u otras plataformas, otros usuarios podrán acceder a esos datos y, conjugándolos con sus propias informaciones, crea nuevas conclusiones. De esta forma, diversos usuarios, con sus propios datos e impresiones, podrán ir generando unos datos más precisos y de mayor utilidad para su análisis, ofreciendo nuevas visiones y enfoques.

Una de las premisas con la que nació la Web 2.0 era que los datos serían clave y empresas como NAVTEQ serían las principales beneficiarias de esta tendencia. Pero lo cierto es que el público y los proyectos abiertos están reemplazando el que se creía que iba a ser el futuro, haciendo que cobre más importancia el lado científico de esta nueva ciencia de los datos. Por tanto, cuanto más social sea esta nueva ciencia, se crearán mejores respuestas y más pertinentes para el nuevo mercado.

Te recomendamos

A3

ADN

Navidad

Recopilatorio

Enamorando

Compartir