Introducción a los data warehouse
DEFINICIÓN
Un data warehouse se encarga de extraer datos de las bases de datos operacionales o fuentes externa, transformar, consolidar, integrar, chequear la integridad y centralizar los datos que la empresa genera en su actividad diaria de negocios y/o información externa con la que este relacionada. Un data warehouse permite el acceso y manipulación de la información, a través de análisis multivariables, con el objetivo final de dar soporte al proceso de toma de desiciones.
Las particularidades de los data warehouse hacen, que los modelos de datos y las estrategias de diseño utilizadas para bases de datos operacionales, generalmente no sirvan para el diseño de un data warehouse. Esto implica, que se utilicen nuevas técnicas y estrategias de diseño.
Los data warehouse pueden crecer y surge la necesidad de dividir la información, los datamarts. Suelen ser soluciones departamentales y almacenan un area de negocio específica. Tienen una estructura óptima, para analizar los datos desde el punto de vista de un departamento.
OBJETIVOS
- Accesibilidad de información por parte de la organización
- Consistencia de la insformación entre las distintas unidades de una organización
- Ayuda a toma de decisiones
- Generación de información de forma flexible
- Controlar el acceso de la información
CARACTERÍSTICAS
- Administra grandes cantidades de información
- Guarda histórico de datos
- Condesa y agrega información
- Integra y asocia información de muchas fuentes
BASES DE DATOS TRADICIONALES VS DATA WAREHOUSE
BASES DE DATOS TRADICIONALES |
DATA WAREHOUSE |
Orientación a transacciones | Orientado a las consultas la consulta |
Actividad operativa | Análisis y toma de decisiones estratégicas |
Proceso puntual | Proceso batch masivos |
Estabilidad | Dinamismo |
Datos desagregados | Niveles de detalle/agregación |
Dato actual | Evolución del dato |
Respuesta de la transacción inmediata | Respuesta masiva |
Modelo relacional | Modelo multidimensional |
Usuarios de perfiles bajos | Usuarios de perfiles altos |
Trata información relacionada con operatividad de cada aplicación | Trata información interna y externa relacionada con el negocio |
PASOS PARA LA CARGA DE UN DATA WAREHOUSE (ETL)
Usualmente un Data warehouse sigue una serie de pasos para la carga de datos:
- Extracción: usualmente de multiples fuentes en procesos batch, para no influir en los operacionales, interfaces con diferentes tecnologías
- Transformación: Manipula información compleja reuniendola de diferentes fuentes. Implementan reglas de negocio. Realiza una limpieza de los datos.Optimizado, para el desempeño y para grandes volumenes
- Carga: almacena los datos en modelos multidimensionales y crea históricos de los datos
Comments are closed.