DATA QUALITY - Sergio Rodrigo

La Calidad de Datos o DQ (Data Quality) es un concepto muy amplio del que se pue-den encontrar tantas definiciones como autores hayan escrito sobre el tema, pero se po-dría resumir como el arte -otros prefieren decir la ciencia- de mantener la información de las organizaciones completa, precisa, consistente, actualizada, única y, lo más impor-tante, válida para el fin que se creó.

El término DQ surgió hace apenas 10 ó 12 años, aunque hoy en día forma parte de los conceptos fundamentales de un sistema gestor de bases de datos, como ya lo eran otros como la integridad o la seguridad.

El interés creciente por el DQ entre las organizaciones, está motivado por la mayor in-terconectividad entre productores y usuarios de datos, ahora más que nunca se comparte información entre distintas entidades, y, para muchas empresas, los datos constituyen su principal activo. Por otro lado, de todos es bien conocido que manejar datos que tienen mala calidad suele ser muy costoso en tiempo y dinero, y, lo que es peor, puede llevar a los responsables de las compañías a tomar decisiones equivocadas.

Este gran auge de la preocupación por la Calidad de Datos, más apreciado en tiempos recientes, ha llevado al nacimiento de nuevas compañías tecnológicas que se dedican a solucionar los problemas de DQ de las empresas y organismos poseedores de gran vo-lumen de información.

Una aplicación clara y concreta de los sistemas DQ es la mejora de la información de nombres y direcciones en bases de datos de clientes. Normalmente, existe un escaso control de los datos de nombre y dirección dentro del conjunto de una B.D. y, general-mente, se desconoce el estado de esos datos y no se sabe realizar una "medición exacta de calidad".

Por la experiencia de DeyDe, más del 13% de esos datos son incorrectos: 9% de códi-gos postales obsoletos, 2,2% de duplicados, 1,7% de direcciones ilocalizables, 1,1% de nombres no identificables, etc.

El origen del problema es que los datos son introducidos manualmente, con los inevi-tables errores de grabación, proceden de diferentes ficheros, por fusiones con otras compañías o de distintos departamentos, y luego hay una serie de factores externos que hacen que queden desactualizados, como cambios de códigos postales, de nombres de vías, etc.

Gracias al sistema de gestión de DQ, específico para nombres y direcciones, del ejem-plo anterior se puede conseguir:

Domicilios.
Corrección y actualización de los nombres de vías y poblaciones erróneos u ob-soletos.
Asignación del código postal, en función de la población, vía y el número.
Asignación del índice de fiabilidad de la dirección, que permite, entre otras co-sas, identificar las direcciones que tienen pocas probabilidades de llegar a su destinatario en un envío de correo.

Nombres.
Identificación de personas físicas y entidades.
Corrección de errores y expansión de las abreviaturas más frecuentes.
Separación de nombre y apellidos y asignación de sexo.

Duplicados.
Mediante distintas técnicas de comparación "por parecido" de los nombres y las direcciones, se pueden identificar los registros duplicados existentes.

El sistema de gestión de DQ de nombres y direcciones, aportará a la entidad que lo im-plemente: un ahorro de costes directos, al evitar envíos duplicados, contribuir a la disminución de las devoluciones de correo y facilitar la integración de datos provinentes de diferentes fuentes; una mejora de imagen y servicio, en los envíos por correo, el cliente percibirá una buena imagen de compañía a través de sus datos correctos y nor-malizados; la posibilidad de realizar unas acciones de marketing precisas y efectivas, mejorará el análisis de datos, permitirá segmentaciones precisas, optimizará la captación de nuevos clientes y su fidelización e incrementará el ratio de respuestas.

En la actualidad hay en España diversas de empresas que se dedican a DQ, como activi-dad única o complementaria, la mayoría de origen extranjero y sólo algunas españolas, que ofrecen a sus clientes soluciones DQ ya sea como servicios outsourcing, mediante la cesión de licencias de uso de software o como servicios Web.

Sergio Rodrigo
Director General
Deyde Informática

Si desea colaborar con esta sección envíe su artículo de opinión sobre algún asunto de actualidad del sector con su foto y firma a [email protected]. Críticas y polémicas serán bienvenidas.

Te recomendamos

Energy Sistem

School

Podcast

BTMB18

Compartir