top of page

Diseño y desarrollo de procesos ETL

Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiéndolos en datos de calidad y veracidad, por último carga y actualiza la Bodega de Datos. Los procesos ETL por lo general consumen mucho tiempo en un proyecto de BI y es punto clave para el éxito.

 

Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiendo en datos de calidad y veracidad por ultimo carga, actualiza en la DW. El proceso extracción, transformación y carga está compuesto por las siguientes etapas:

 

a. Extracción: Este proceso obtiene los datos físicamente de las distintas fuentes de información utilizando técnicas y herramientas ETL, para la selección del método es necesario tener en cuenta algunas problemáticas de la extracción de datos como lo son el tipo de plataforma, protocolos, juego de caracteres, tipos de datos, etc.

 

b. Limpieza: Al recuperar los datos en bruto, se requiere comprobar la calidad de los mismos y corregir errores relacionados con campos nulos, duplicados, inconsistencias en los datos, etc.

 

Etapas de la limpieza de datos:

• Depurar los valores: Se pueden separar los datos de acuerdo con la estructura de destino de los datos o la regla definida para esto.

• Corregir: A partir de fuentes de datos externas se puede verificar la información existente.

• Estandarizar: A partir de formatos definidos por las reglas de negocio, se sustituyen valores en los campos de datos

• Relacionar: Verifica en otras fuentes la existencia de datos relacionados, para evitar duplicados.

• Consolidar: A partir de la identificación de relaciones entre registros, se llevan a una sola representación.

 

c. Transformación: Una vez que los datos se encuentran “limpios”, se transforman de acuerdo con las reglas de negocio y las características de las herramientas a utilizar. En la transformación se consideran cambios de formato, cambios de códigos, adición de valores derivados y agregados. Es importante recordar que los agregados cumplen un valor importante, ya que al almacenar el resultado de estos cálculos en la Bodega de Datos, se obtendrá un mayor rendimiento al realizar las consultas respectivas, sin olvidar que el nivel de granularidad puede estar determinado por la dimensión del tiempo.

 

d. Integración: En este proceso se realiza la carga de los datos y debe validarse que los datos cargados en la bodega de datos son consistentes.con los que se encontraban en el medio transaccional.

 

e. Actualización: Este proceso es en el cual se determina la periodicidad con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos.

 

 

© 2023 by Marketing Solutions. Proudly created with Wix.com

  • Twitter Clean
  • Google+ Clean
  • Facebook Clean
bottom of page