Introducción a los data warehouse

Data warehouse

Data warehouse

 

DEFINICIÓN

Un data warehouse se encarga de extraer datos de las bases de datos operacionales o fuentes externa, transformar, consolidar, integrar, chequear la integridad y centralizar los datos que la empresa genera en su actividad diaria de negocios y/o información externa con la que este relacionada. Un data warehouse permite el acceso y manipulación de la información, a través de análisis multivariables, con el objetivo final de dar soporte al proceso de toma de desiciones.

Las particularidades de los data warehouse hacen, que los modelos de datos y las estrategias de diseño utilizadas para bases de datos operacionales, generalmente no sirvan para el diseño de un data warehouse. Esto implica, que se utilicen nuevas técnicas y estrategias de diseño.

Los data warehouse pueden crecer y surge la necesidad de dividir la información, los datamarts. Suelen ser soluciones departamentales y almacenan un area de negocio específica. Tienen una estructura óptima, para analizar los datos desde el punto de vista de un departamento.

OBJETIVOS

  • Accesibilidad de información por parte de la organización
  • Consistencia de la insformación entre las distintas unidades de una organización
  • Ayuda a toma de decisiones
  • Generación de información de forma flexible
  • Controlar el acceso de la información

 

CARACTERÍSTICAS

  • Administra grandes cantidades de información
  • Guarda histórico de datos
  • Condesa y agrega información
  • Integra y asocia información de muchas fuentes

 

BASES DE DATOS TRADICIONALES VS DATA WAREHOUSE

BASES DE DATOS TRADICIONALES
DATA WAREHOUSE
Orientación a transacciones Orientado a las consultas la consulta
Actividad operativa Análisis y toma de decisiones estratégicas
Proceso puntual Proceso batch masivos
Estabilidad Dinamismo
Datos desagregados Niveles de detalle/agregación
Dato actual Evolución del dato
Respuesta de la transacción inmediata Respuesta masiva
Modelo relacional Modelo multidimensional
Usuarios de perfiles bajos Usuarios de perfiles altos
Trata información relacionada con operatividad de cada aplicación Trata información interna y externa relacionada con el negocio

 

PASOS PARA LA CARGA DE UN DATA WAREHOUSE (ETL)

Usualmente un Data warehouse sigue una serie de pasos para la carga de datos:

  • Extracción: usualmente de multiples fuentes en procesos batch, para no influir en los operacionales, interfaces con diferentes tecnologías
  • Transformación: Manipula información compleja reuniendola de diferentes fuentes. Implementan reglas de negocio. Realiza una limpieza de los datos.Optimizado, para el desempeño y para grandes volumenes
  • Carga: almacena los datos en modelos multidimensionales y crea históricos de los datos

Comments are closed.