¿Qué es DataWareHouse?
Un DataWarehouse es un una colección de datos integrados, variantes en el tiempo y no volatiles que permiten la mejora de la toma de decisiones de la administración.
El concepto de DWH está teniendo una gran aplicación en la actualidad para el desarrollo de las empresas, como almacén de datos. Sus objetivos incluyen la reducción de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios.
Para diseñar una buena arquitectura de DWH es necesario como primer paso conocer bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas que nos van a suministrar los datos. Además, hacer un buen diseño del área de transformación de datos, cuáles son las transformaciones que se van a realizar y cómo se va a implementar el modelo dimensional con sus tablas de hechos y de dimensiones es el segundo paso a seguir.
¿Por qué se justifica construir un Datawarehouse?
Generalmente, los sistemas transaccionales o
OLTP usan estructuras normalizadas, en las cuales se optimizan las inserciones y actualizaciones de artículos e incluso algunas selecciones, pero es menos probable que el sistema se organice de forma tal que produzca reportes eficientes para datos resumidos con cierta jerarquía. Y es aquí donde debería usarse el DWH, que usa los datos relevantes de fuentes existentes y los combina en una estructura que ha sido optimizada para las selecciones.
¿Cuáles pudieran ser consultas típicas en este sistema para la toma de decisiones de la empresa?.
* ¿Cuál ha sido el total de ingresos de los clientes por meses y años?
* ¿Cuáles han sido los pagos realizados por los clientes y por qué conceptos?
El DWH se soporta sobre modelo dimensional:
El modelo dimensional divide el mundo de los datos en dos grandes tipos:
las medidas y las descripciones del entorno de estas medidas
(Dimensiones). Las medidas, que generalmente son numéricas, se almacenan en las tablas de hechos y las descripciones de los entornos que son textuales se almacenan en las tablas de dimensiones.
Dimensiones
•Son calificadores que dan sentido a los hechos
•Son las diferentes perspectivas por la que se puede ver los hechos de negocio
Ejemplo de dimensiones: Tiempo, Producto, Ubicacion
Ademas las dimensiones pueden ser jerarquicas, cada elemento de la dimension puede ser modelado como una entidad.
Ejm: Producto - TipoProducto - Fabricante
Medidas
•Son datos cuantitativos acerca de un tema de negocio (acerca de los hechos)
•Generalmente son numéricos.
•Ejemplo: Cantidad, monto, dias, entre otros
Espero les haya servido :)
Fuente: http://en.wikipedia.org/wiki/Datawarehouse