Principios de un Datawarehouse

La inclusion de todos los principios de un Datawarehouse, no es algo de caracter obligatorio, pero seguirlos puede llevarnos al exito y valor del mismo.

Un Datawarehouse debera incluir datos que sean aplicables a la empresa, este es el valor y relevancia enraizada de un Datawarehouse.

Asi que despues de leer a varios autores…. He sintetizado los principios de un buen Datawarehouse.

* Orientacion por Temas: Los datos seran agrupados por Temas, esto con la finalidad de absorver cambios, sin necesidad de hacer grandes cambios en la arquitectura del mismo. Un Datawarehouse jamas presentara datos que reflejen la manipulacion de los datos operacionales. En su lugar reflejara datos que representan las mas importantes areas dentro de la empresa.

* Integracion de los Datos: Aun cuando el dato provenga de distintas aplicaciones, departamentos,etc. Las diferencias deberian ser suavizadas para que los datos contengan el mismo look and feel.
a) Por Forma: Si se tiene el formato 123-(34) y 12334, uno de estos dos formatos debera ser impuesto sobre el otro.
b) Por Funcion: Cuando dos o mas datos representan la misma cosa pero con nombres diferentes, estos dos nombres deberan ser remplazados por uno solo.
c) Por Granulacion: Cuando dos o mas elementos aplican diferentes grados gerarquicos (distrito,region) para definir la misma cosa, estos 2 o mas elementos seran resueltos al mismo nivel de Jerarquia o Detalle.

* Jamas Volatil: A diferencia de los datos en operacion de las aplicaciones, los cuales tienen el futuro de ser descartados una vez que la compañia haya terminado de usar estos. En el Datawarehouse siempre deberan permanecer con la intension de poder expresar lo que es la empresa a lo largo del tiempo.

* Variante al Tiempo: Todos los datos tienen un contexto sobre un momento en el tiempo. Un Datawarehouse debera mantener ese concepto para expresar los eventos de la empresa a lo largo del tiempo sobre 3 conceptos:
a) Que era
b) Que es actualmente
c) Como sera si nada llega a cambiar
Este es un principio es una significante diferencia de aplicaciones operacionales, las cuales funcionan en el ahora, mas que en los eventos pasados.

* Ofrecer una unica version de la verdad: Un Datawarehouse debera definir cada elemento de los datos de una manera que… todos los miembros de la empresa asocien una y solo una pregunta con los datos de ese elemento.
Aqui un ejemplo de lo que se debera evitar:
— Cuantos carros fueron ensamblados ?
1.- Total de ensamblados nuevos 32,000
2.- Total de ensamblados reconstruidos 1,000
3.- Total de ensamblados para empresas filiales 19,000

Aqui un ejemplo de lo que debe ser:
— Cuantos carros nuevos fueron ensamblados ?
1.- Total de ensamblados nuevos 32,000

Esto permite que cuando todos los miembros de una empresa miren hacia el dato elemento, lo hagan todos con un solo entendimiento de su significado.

* Inversion a largo plazo: El Datawarehouse debera ser suficientemente flexible, escalable para absorver los cambios ademas de agregar un valor a la compañia a largo plazo. Ofreciendo a su vez un retorno de inversion atraves de su longevidad y estabilidad

Nota Importante: El analista ETL es el responsable de que los principios del Datawarehouse se cumplan.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s