BASES DE DATOS

DATAWAREHOUSE

Un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. No siendo un producto, lenguaje o copia del sistema transaccional.

Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea). El almacenamiento de los datos no debe usarse con datos de uso actual.

Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea necesario (data marts).

Uso del Almacén de Datos.

En un almacén de datos lo que se quiere es contener datos que son necesarios o útiles para una organización, es decir, que se utiliza como un repositorio de datos para posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el momento óptimo y en el formato adecuado. El almacén de datos da respuesta a las necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fácilmente consultas sobre sus almacenes de datos sin tocar o afectar a la operación del sistema.

En el funcionamiento de un almacén de datos son muy importantes las siguientes ideas:

  • Integración de los datos provenientes de bases de datos distribuidas por las diferentes unidades de la organización y que con frecuencia tendrán diferentes estructuras (fuentes heterogéneas).
  • Separación de los datos usados en operaciones diarias de los datos usados en el almacén de datos para los propósitos de explotación, de ayuda en la toma de decisiones, para el análisis y para operaciones de control.
  • Periódicamente, se importan datos al almacén de datos desde las distintas fuentes de información (aplicaciones ERP, ficheros, etc.) realizando las transformaciones necesarias y aplicando las reglas de negocio oportunas.

Ventajas e Inconvenientes del Almacén de Datos

Aunque una empresa que no posee un datawarehouse tiene riesgo de seguir siendo competitiva y que sea capaz de gestionar eficientemente su negocio, debemos analizar las ventajas y los inconvenientes que se tienen a la hora de abordar un proyecto de datawarehousing.

Ventajas

Hay muchas ventajas por las que es altamente recomendable usar un almacén de datos son:

  • Los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los usuarios finales.
  • Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia, por ejemplo: obtener los ítems con la mayoría de las ventas en un área en particular dentro de los últimos dos años; informes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori, etc.
  • Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.

Inconvenientes

Utilizar almacenes de datos también plantea algunos inconvenientes, como:

  • A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados.
  • Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
  • A veces, ante una petición de información estos devuelven una información poco óptima, que también supone una pérdida para la organización.

A menudo existe una delgada línea entre los almacenes de datos y los sistemas operacionales. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el data warehouse. Resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse.