El documento describe la creación de un ETL (Extracción, Transformación y Carga) para una base de datos DWBIFacturacion. Se crean tablas dimensionales como DimFecha, DimArticulo y DimCliente, así como una tabla de hechos FactVenta. Se utiliza SQL Server Integration Services para extraer datos de las tablas origen y cargarlos en las tablas dimensionales y de hechos de la nueva base de datos, facilitando así el análisis de datos.
El documento describe la creación de un ETL (Extracción, Transformación y Carga) para una base de datos DWBIFacturacion. Se crean tablas dimensionales como DimFecha, DimArticulo y DimCliente, así como una tabla de hechos FactVenta. Se utiliza SQL Server Integration Services para extraer datos de las tablas origen y cargarlos en las tablas dimensionales y de hechos de la nueva base de datos, facilitando así el análisis de datos.
El documento describe la creación de un ETL (Extracción, Transformación y Carga) para una base de datos DWBIFacturacion. Se crean tablas dimensionales como DimFecha, DimArticulo y DimCliente, así como una tabla de hechos FactVenta. Se utiliza SQL Server Integration Services para extraer datos de las tablas origen y cargarlos en las tablas dimensionales y de hechos de la nueva base de datos, facilitando así el análisis de datos.
Creacin de un ETL(Extraccin, Transformacin y Carga)
Creando la base DWBIFacturacion
Tabla DimFecha
Tabla DimArticulo
Tabla DimCliente
Tabla FactVenta
Diagrama de la base FacturacionDW
Creamos un nuevo proyecto de BIDS con Integration Service
Seleccionar la carpeta en la que se guardara los archivos creados por BIDS
Se abrir la interfaz del nuevo proyecto
Se cambia el nombre del paquete el cual se utilizara
Creamos una nueva tarea de flujos de datos
Abrimos la tarea de flujo de datos, y dentro de esta creamos un Origen de OLE DB y un Destino de OLE DB.
Origen OLE DB Procedemos a crear un String de conexin a la base de datos desde el origen. Damos clic en nueva
Elegimos el nombre del servidor de base de datos, nos autenticamos con nombre de usuario y contrasea, y por ultimo seleccionamos la base de la cual vamos a extraer los datos.
Damos clic en generar consulta para elegir los datos que se van a cargar a la dimensin
Seleccionamos los datos que vamos a extraer para la tabla DimArticulo, y damos en aceptar
Destino OLE DB Tabla DimArticulos Procedemos a crear un String de conexin a la base de datos para el destino. Damos clic en nueva
Elegimos el nombre del servidor de base de datos, nos autenticamos con nombre de usuario y contrasea, y por ultimo seleccionamos la base a la cual vamos a cargar los datos.
Seleccionamos en modo de acceso a datos Tabla o vista, en nombre de la tabla DimArticulo, y damos clic en Asignaciones
Se asignan los valores que sern cargados a la dimensin
Al final ejecutamos y observamos que la carga de datos se realiz correctamente
Comprobamos en SQL Server que los datos han sido cargados a la dimensin.
Para el resto de tablas se realiza el mismo procedimiento Tabla DimClientes Origen OLE DB
Destino OLE DB
Resultados
Tabla DimFecha Origen OLE DB
Destino OLE DB
Comprobacin de resultados
Tabla FactVenta Origen OLE DB Se debe crear un Nuevo String de conexin con la base de datos master, la cual tiene acceso a todas las bases de datos del SQL Server
Destino OLE DB
Resultados
Al final se tendr cuatro tareas de flujo (uno por cada dimensin y otro por la tabla de hechos).
Conclusiones: La implementacin del modelo de hechos dimensionales facilita la etapa de investigacin al ya que disminuye la complejidad del diseo original dejando el diseo mejor estructurado. Maximiza la velocidad de bsqueda y rendimiento, esta mejora se nota cuando los datos sobrepasan en millares el nmero de datos almacenados. La herramienta de inteligencia de negocios BIDS fue de gran ayuda durante la elaboracin del ETL al crear un enlace mediador entre los sistemas de base de datos origen y la base de datos destino. El ETL permite unir datos de distintas fuentes en una sola tabla, convirtiendo a un formato comn. En la etapa de transformacin se pudo realizar limpieza de datos es decir solo se escogieron datos que dan valor al negocio, tambin se pudo detectar y borrar errores e inconsistencias como la fecha que se la pudo tratar de una manera ms detallada y as tener un mejor entendimiento. En la carga de datos se observ que hubo una demora significativa, se puede predecir que para una mayor cantidad de datos el tiempo de carga ser mayor.