Fases para Implementar una Solución de Business Intelligence (BI)
La implementación de una solución basada en herramientas de BI requiere seguir las siguientes fases:
- Definición de Necesidades y Origen de Datos: Análisis detallado de las especificaciones para los diferentes usuarios del sistema.
- Diseño de la Arquitectura Tecnológica: Definición de los productos a integrar y las necesidades de almacenamiento y procesamiento.
- Construcción del Data Warehouse y Modelos de Explotación: Desarrollo de los programas de carga de datos.
Sistemas de Data Warehousing: El Núcleo de las Aplicaciones BI
Los sistemas de Data Warehousing son fundamentales para las aplicaciones de Business Intelligence. Se componen de tres elementos principales:
- Recogida y gestión de grandes volúmenes de datos.
- Análisis de los datos.
- Software de consulta amigable e intuitivo.
Definición de Data Warehouse
Un Data Warehouse (DW) es un gran almacén de datos que integra información de diversas fuentes:
- Sistemas transaccionales de la empresa.
- Fuentes externas.
El DW separa los sistemas transaccionales de los informacionales, evitando que el análisis de datos interfiera con el procesamiento de transacciones. Los datos se almacenan de forma unificada, homogénea y accesible, con diferentes niveles de agrupación. Un Data Mart es un almacén de datos más pequeño, generalmente restringido a un área temática o departamento.
Etapas en la Construcción de un Data Warehouse
- Captura de Datos: Extracción de datos de las fuentes seleccionadas, utilizando herramientas que soportan múltiples formatos.
- Tratamiento, Conversión y Transformación de Datos: Operaciones de limpieza, homogeneización, mezclado y enriquecimiento de los datos. Esto incluye:
- Detección y corrección de errores.
- Análisis de consistencia y homogeneización de valores.
- Tratamiento de valores ausentes.
- Eliminación de campos no significativos.
- Reestructuración y adición de nuevos campos.
- Codificación de campos.
- Cálculo de campos derivados.
Sistemas de Gestión de Datos en un Data Warehouse
Se pueden utilizar tres tipos de sistemas de gestión de bases de datos:
- Base de datos relacional tradicional.
- Base de datos relacional con diseño en estrella y desnormalización de tablas.
- Base de datos multidimensional.
Explotación del Data Warehouse
Las herramientas de explotación del DW facilitan el análisis de datos para generar informes y gráficos útiles para la toma de decisiones. Entre ellas se encuentran:
- Herramientas de Queries and Reporting: Generación de consultas e informes en sistemas de bases de datos relacionales.
- Análisis Multidimensional (OLAP: On Line Analytical Processing): Análisis de datos a través de dimensiones y jerarquías.
- Herramientas de Data Mining: Técnicas avanzadas para detectar relaciones entre los datos y obtener información no evidente (patrones de consumo, predicción del comportamiento, etc.).
Análisis Multidimensional (OLAP)
El modelo multidimensional se compone de:
- Dimensiones.
- Medidas o indicadores.
- Jerarquía de dimensiones.
Herramientas de Data Mining
Data Mining es el proceso de búsqueda y análisis de datos para revelar información oculta y valiosa. La metodología suele incluir las siguientes etapas:
- Muestreo
- Exploración
- Modificación
- Modelización del comportamiento
- Evaluación: comprobación de la validez del modelo.
- Presentación gráfica de los resultados.
Tipos de Herramientas en Paquetes de Data Mining
- Herramientas Estadísticas:
- Cálculo de parámetros estadísticos.
- Técnicas bayesianas.
- Test de hipótesis.
- Técnicas de regresión lineal.
- Análisis multivariante.
- Análisis cluster.
- Técnicas de Inteligencia Artificial:
- Algoritmos genéticos.
- Redes neuronales: Simulan la capacidad de aprendizaje del cerebro humano.
- Herramientas Simbólicas:
- Árboles de decisión: Algoritmos de clasificación de clientes.
- Reglas de asociación: Establecen conexiones entre eventos.
- Identificación de patrones secuenciales: Evaluación de eventos en una secuencia temporal.
Aplicaciones de Data Mining
- Estudio de asociaciones de productos y análisis de afinidades.
- Segmentación y agrupamiento de clientes (clustering).
- Clasificación de clientes:
- Técnicas de scoring.
- Análisis de riesgos.
- Prevención del fraude.
- Predicción del comportamiento de clientes.
Explotación de la Información Registrada en Internet
El análisis de registros de conexión a un sitio web permite determinar el éxito de páginas y contenidos, evaluar campañas de promoción, estudiar fallos en las conexiones, etc.
Técnicas de Web Mining
Uso de herramientas de minería de datos para extraer información sobre la utilización de los servicios de un sitio web. Áreas de trabajo:
- Minería de la estructura del website.
- Minería del contenido del website.
- Minería de la utilización del website.
Aplicaciones de Apoyo a la Toma de Decisiones y Herramientas de Soporte a la Gestión
- Modelos de consolidación empresarial.
- Planificación y control presupuestario.
- Cuadros de mando analíticos/funcionales.
- Cuadro de mando integral.
- Reporting de negocio o financiero.
- Análisis de correlaciones, técnicas estadísticas avanzadas o minería de datos.
Las Herramientas de BI y la Toma de Decisiones Estratégicas
Las herramientas de BI facilitan la toma de decisiones en áreas como:
- Planificación y control de la estrategia comercial y de marketing.
- Gestión logística y productiva.
- Planificación y control de los recursos empresariales (humanos, materiales y económico-financieros).
Cuadro de Mando Integral (Balanced Scorecard)
Instrumento de planificación y control para formular e implantar la estrategia. Sus objetivos son:
- Concretar la estrategia en términos operativos y fijar objetivos con indicadores.
- Liderar el cambio mediante directrices de actuación y aprendizaje.
- Determinar las hipótesis de la estrategia mediante relaciones causales.
- Guiar el esfuerzo de la organización mediante el desglose de objetivos.