Marketing

DATOS SIMPLES SEMIESTRUCTURADOS

Estamos muy familiarizados con los datos estructurados: pulcramente modelados, organizados, formulados y formateados de forma que pueden ser fácilmente manipulados y gestionados. Esta modalidad incluye las bases de datos, hojas de cálculo, plantillas o archivos de registro, entre otros. Es relativamente fácil trabajar con datos estructurados y ciertas aplicaciones informáticas pueden organizarlos, analizarlos y mostrarlos.

Por otro lado se encuentran los datos no estructurados. Se trata de textos como el que está leyendo ahora, que incorporan un bloque de información que no encajaría tal cual en una base de datos. También el texto de las diapositivas o el de los correos postales y electrónicos contiene datos no estructurados.

Pero hay otra clasificación intermedia del contenido, la de los datos semiestructurados. Se refiere a la información que sigue una especie de estructura implícita, pero no tan regular como para poder ser gestionada y automatizada como la información estructurada. Ejemplos de este tipo de datos son, por ejemplo, las páginas web, que siguen ciertas pautas comunes y albergan contenido en el html y metadatos entre las etiquetas. Otro ejemplo de información semiestructurada son las señales de tráfico y la señalética en general.

El aspecto más interesante de los datos semiestructurados es que, aunque no sigan una regla estricta de formato, mantienen una regularidad suficiente como para que se pueda extraer alguna información interesante. El formato va evolucionando hasta convertirse en un protocolo o fórmula generalmente aceptada, con una serie de características definitorias. Se podría decir que estos datos semiestructurados poseen sus propios “metadatos semiestructurados”, que describen los objetos que trata el texto y las relaciones que se pueden inferir. Ejemplos de estos datos son las notas de defunción, las solicitudes de empleo, los listados de propiedades inmobiliarias, avisos legales o los nombres de cuentas bancarias.

En el universo de la visión de 360º, el CRM y el CDI (Customer Data Integration – Integración de Datos de Clientes), muchas veces se olvida que gran parte del conocimiento que buscamos no se encuentra explícitamente en archivos de datos estructurados, y que esos datos pueden extraerse de fuentes no habituales. Muy a menudo, los datos relevantes que se pueden extraer de información semiestructurada suponen conocer la identificación de una entidad o de sus relaciones.

Un ejemplo de aplicación de información semiestructurada: en un proceso de selección de personal se puede utilizar una “red de inteligencia” que clasifique las habilidades, experiencias y conocimientos de cada candidato y las relacione entre si, o clasifique a los candidatos en función de una serie de variables. De esta forma el encargado de la selección podrá establecer patrones y comparar a los candidatos desde distintos puntos de vista para saber cuál es el más adecuado para el puesto.

Te recomendamos

#Highway2Sales

NH

Atresmedia

ADN by DAN

Compartir