You are on page 1of 4

Datawarehouse

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar informacin de
una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de pespectivas y con
grandes velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones el
primer paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras
en las que se almacena la informacin (modelos de tablas en estrella, en
copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la
informacin es homognea y fiable, y permite la consulta y el tratamiento
jerarquizado de la misma (siempre en un entorno diferente a los sistemas
operacionales).

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se traduce literalmente como almacn
de datos. No obstante, y como cabe suponer, es mucho ms que eso. Segn defini el propio Bill Inmon, un
datawarehouse se caracteriza por ser:
Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente,
por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La
informacin suele estructurarse tambin en distintos niveles de detalle para adecuarse a las distintas
necesidades de los usuarios.
Temtico: slo los datos necesarios para el proceso de generacin del conocimiento del negocio se
integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y
entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una nica tabla del datawarehouse. De esta forma, las peticiones de informacin sobre
clientes sern ms fciles de responder dado que toda la informacin reside en el mismo lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un datawarehouse. En los sistemas
operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por
el contrario, la informacin almacenada en el datawarehouse sirve, entre otras cosas, para realizar anlisis
de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el
tiempo para permitir comparaciones.
No voltil: el almacn de informacin de un datawarehouse existe para ser ledo, pero no modificado. La
informacin es por tanto permanente, significando la actualizacin del datawarehouse la incorporacin de
los ltimos valores que tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre lo
que ya exista.
Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos
permiten saber la procedencia de la informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.

Los metadatos sern los que permiten simplificar y automatizar la obtencin de la informacin desde los sistemas
operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido, son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su propio lenguaje de negocio,
indicando qu informacin hay y qu significado tiene. Ayudar a construir consultas, informes y anlisis,
mediante herramientas de Business Intelligence como DSS, EIS o CMI.
Dar soporte a los responsables tcnicos del datawarehouse en aspectos de auditora, gestin de
la informacin histrica, administracin del datawarehouse, elaboracin de programas de extraccin de la
informacin, especificacin de las interfaces para la realimentacin a los sistemas operacionales de los
resultados obtenidos... etc.
Por ltimo, destacar que para comprender ntegramente el concepto de datawarehouse, es importante entender
cual es el proceso de construccin del mismo, denominado ETL (Extraccin, Transformacin y Carga), a partir de
los sistemas operaciones de una compaa:
Extraccin: obtencin de informacin de las distintas fuentes tanto internas como externas.
Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin.
Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos.

Una de las claves del xito en la construccin de un datawarehouse es


el desarrollo de forma gradual, seleccionando a un departamento
usuario como piloto y expandiendo progresivamente el almacn de datos a los dems usuarios. Por ello es
importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en
el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo.

Principales aportaciones de un datawarehouse


Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose en
informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones ocultas
entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos
escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la relacin con el cliente.

Supone una optimizacin tecnolgica y econmica en entornos de Centro de Informacin, estadstica o de


generacin de informes con retornos de la inversin espectaculares.

Datamart
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea
de negocio especfica. Se caracteriza por disponer laestructura ptima de datos para analizar la informacin al
detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser
alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de
informacin.
Por tanto, para crear el datamart de un rea funcional de la empresa es preciso encontrar la estructura ptima
para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos OLTP, como el
propio datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De esta forma se pueden plantear dos tipos de
datamarts:

Datamart OLAPSe basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de
cada rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de
creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final
que se utilice.

Datamart OLTPPueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es introducir
mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando
las caractersticas particulares de cada rea de la empresa. Las estructuras ms comunes en este sentido son las
tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas
materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la
reescritura de queries (aunque slo es posibles en algunos SGBD avanzados, como Oracle).
Los datamarts que estn dotados con estas estructuras ptimas de anlisis presentan las siguientes ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validacin directa de la informacin
Facilidad para la historizacin de los datos
Si no est familiarizado con el concepto de datamart, puede resultarle til, adems, examinar las siguientes
definiciones:
Datawarehouse
Sistemas de Soporte a la Decisin (DSS)
Bases de datos OLTP y OLAP
Datamining

Tipos de sistemas de informacin


Un sistema de informacin es un grupo de elementos utilizados para la administracin de datos ,
los cuales se encuentran coordinados entre s para su uso ulterior. Estos elementos, adems, fueron
concebidos con el objeto de lograr un determinado fin. Desde el punto de vista empresarial, los sistemas de
informacin tienen como propsito perfeccionar las actividades llevadas a cabo en una organizacin, y as
alcanzar ventajas competitivas.
Siguiendo esta lnea, y de acuerdo a su funcin se distinguen tres tipos de sistemas de informacin:
SISTEMA DE PROCESAMIENTO DE TRANSACCIONES: cuando un sistema recopila, almacena y altera la
informacin creada a partir de transacciones llevadas a cabo dentro de una organizacin se denomina
sistema de procesamiento de transacciones. Tiene como finalidad procesar las transacciones diarias de una
empresa, acumulando toda la informacin recibida en una base de datos para su posterior consulta.
SISTEMA DE INFORMACIN GERENCIAL: un sistema de informacin gerencial es aquel utilizado por la
empresa para solventar inconvenientes en la misma. Es decir, el objetivo del mismo es la suministracin de
informacin para la resolucin de problemas a travs de la interaccin entre tecnologas y personas.
Los datos aportados por el sistema deben disponer de cuatro cualidades elementales: calidad, oportunidad,
cantidad y relevancia.
SISTEMA DE SOPORTE A DECISIONES: este sistema se basa en el estudio y la comparacin entre un
conjunto de variables con el objeto de contribuir a la toma de decisiones dentro de una empresa. El apoyo
dado por el sistema involucra la estimacin, valoracin y balance entre alternativas. Al igual que el sistema
de informacin gerencial, esta tecnologa interacciona con personas en el filtrado de informacin que permite
optar por la decisin mas acertada.
SISTEMA DE INFORMACION EJECUTIVA: esta tecnologa es utilizada por los gerentes de una empresa, ya
que permite acceder a la informacin interna y externa de la misma, disponiendo de los datos que puedan
llegar
a
afectar
su
buen
rendimiento.
De esta manera, el ejecutivo podr conocer el estado de todos los indicadores, incluso aquellos que no
cumplan con las expectativas y a partir de esto, tomar las medidas que considere adecuadas

You might also like