martes, 24 de enero de 2012

¿Por que un almacén de datos es diferente a una base de datos operacionales?

Uno de los errores típicos cuando nos enfrentamos a la construcción de un almacén de datos es intentar replicar el modelo operacional.

Un almacén de datos es diferente a una base de datos operacionales porque su finalidad y objetivos son  distintos. Haciendo una analogía con el transporte, si quiero entregar una carta en una oficina en el centro de la ciudad contrato a un mensajero que vaya en moto y lo haga de forma ágil y rápida. Si quiero entregar 2 toneladas de papel contrato a un camión. Ambos son transportes, pero con características distintas que responden a necesidades distintas.

He aquí una tabla comparativa:

Datos Primitivos / OperacionalesDatos Derivados / Data Warehouse
Orientados a la aplicaciónOrientados al sujeto
DetalladosSumarizados, al menos refinados
Exacta, al momento del accesoRepresenta valores a través del tiempo
Sirve a los oficinistas/trabajadoresSirve a los directivos
Puede ser actualizadaNo se actualiza
Se ejecuta repetitivamenteSe ejecuta heurísticamente
Los requerimientos para procesar se entiende a prioriLos requerimientos para procesar se entienden a posteriori
Compatible con entornos de desarrollo tradicionalesIncompatible con entornos de desarrollo tradicionales
Accesible atómicamenteAccesible por conjuntos de datos
Orientado a la transacciónOrientado al análisis
No redundanteRedundante
Estructura estáticaEstructura dinámica
Pequeños volúmenes de datosGrandes volúmenes de datos
Alto usoBajo uso


El motivo principal de por que deben ser bases de datos distintas con modelos distintos  es por que se les va a dar usos distinto y lo que es bueno para uno es malo para el otro. Interactuamos con la información de forma distinta por lo que debe estar estructurada de forma distinta. 

4 comentarios:

  1. hola , me podria explicar la diferencia de un ODS y un almacen de datos ?

    es importante , por que ncesito saber cual es de los 2 usar si quiero mostrar estadisticas y texto ,(opiniones , acuerdos )

    ResponderEliminar
  2. y el Pentaho BI server me permitiria hacerlo correctamente

    ResponderEliminar
  3. Un ODS (http://es.wikipedia.org/wiki/Almac%C3%A9n_operacional_de_los_datos) es un almacén de datos operacional.

    La diferencia con un almacén de datos genérico es que está especialmente orientado a un área de negocio. Es decir, si toda empresa mediana-grande debería tener un almacén de datos relativos a la empresa, un ODS sería lo mismo pero orientado a un ámbito concreto.

    Pentaho Data Integration te ayudará a crearlo.

    ResponderEliminar