Business Intelligence
Actualmente, en las actividades diarias de cualquier organización, se generan datos como producto
secundario, que son el resultado de todas las transacciones que se realizan. Es muy común, que los mismos
se almacenen y administren a través de sistemas transaccionales en bases de datos relacionales.
Dado este panorama, las soluciones del Grupo eGlu se enfocarán en que estos datos se conviertan en
información que enriquezcan las decisiones de nuestros socios de negocio; permitiendo que el proceso de
toma de decisiones esté fundamentado sobre un amplio conocimiento de sí mismo y del entorno,
minimizando de esta manera el riesgo y la incertidumbre.
El objetivo de Grupo eGlu es el de colaborar en traducir los objetivos de nuestros clientes en indicadores
de estudio, para que luego puedan ser analizados desde diferentes perspectivas, con el fin de encontrar
información que no solo se encargue de responder a preguntas de lo que está sucediendo o ya sucedió, sino
también, que posibilite la construcción de modelos mediante los cuales se podrán predecir eventos futuros,
o tomar decisiones estratégicas y tácticas bien fundamentadas y con un alto grado de certeza.
Acerca de Grupo eGlu BI:
Con respecto a Business Intelligence nos especializamos en los siguientes ítems:
• Gestión de Proyectos.
• Análisis de requerimientos y/o necesidades.
• Confección de procesos ETL.
• Calidad de Datos.
• Performance en consultas.
• Modelado de Data Warehouse.
• Configuración, instalación y mantenimiento de Plataformas BI.
• Creación de Reportes Básicos, Ad Hoc, con parámetros de entrada, etc.
• Reporting Avanzado.
• Configuración de una plataforma para que el usuario cree sus propios Reportes.
• Configuración avanzada de la plataforma Pentaho (redireccionamiento de metadata, xactions de
sistema, etc.).
• Desarrollo de plugins para xactions de Pentaho.
• Modelado multidimensional (cubos, atributos, métricas, jerarquías, etc.).
• Diseño e implementación de Dashboards, con la inclusión de gráficos flash.
• Testing.
• Capacitación de usuarios.
1
Soluciones Open Source Business Intelligence
Extracción, Transformación y Carga de Datos:
Introducción:
Para llevar a cabo el proceso de extraer los datos desde las fuentes de datos transaccionales (OLTP), para
luego manipularlos, integrarlos y transformarlos, y posteriormente cargar los resultados obtenidos en el
Data Warehouse, es necesario contar con algún proceso que se encargue de ello. Precisamente, los
procesos ETL o simplemente ETL (Extracción, Transformación y Carga) son los que cumplirán con tal fin.
Tal y como sus siglas lo indican, los ETL, extraen datos de las diversas fuentes que se requieran, los
transforman para resolver posibles problemas de inconsistencias entre los mismos y, finalmente, los cargan
en el depósito de datos.
En síntesis, las funciones específicas de los ETL son tres:
• Extracción.
• Transformación.
• Carga.
Detalle Técnico:
Al realizar los diferentes ETL nos aseguramos que los datos sean tratados de acuerdo a las reglas de negocio
preestablecidas y que se conviertan en una fuente confiable de información. Esto se lleva a cabo con el
principal objetivo de que nuestros socios de negocios no deban preocuparse del origen estos datos y solo
deban enfocarse en analizar su negocio.
Además poseemos basta experiencia en:
• Analisis de requerimientos.
• Calidad de datos.
• Limpieza de datos.
• Performance en consultas.
• Manejo de dimensiones lentamente variables.
• Manejo de variables de entorno.
• Construcción de scripts en lenguaje Java.
• Testing.
• Documentación.
Herramientas:
Para la construcción y ejecución de los procesos ETL utilizamos:
• Pentaho Data Integration: es una herramienta open source muy potente que tiene la característica
de correr en cluster en caso de requerir potencia en el cálculo.
Contamos además con la experiencia necesaria para trabajar con herramientas que nuestros socios de
negocios tengan a su disposición, por ejemplo:
• Talend.
• MS Analysis Service.
• IBM DB2 Warehouse Manager.
• IBM Cognos.
• Oracle Warehouse Builder.
2
Data Warehouse:
Introducción:
Según William Harvey Inmon:
“Un Data Warehouse es una colección de datos orientada al negocio, integrada, variante en el tiempo y no
volátil para el soporte del proceso de toma de decisiones de la gerencia”.
Básicamente, un Data Warehouse es una gran base de datos centralizada e integrada, que debe ser
estructurada multidimensionalmente, es decir, a través de tablas de dimensiones y tablas de hechos.
Detalle Técnico:
Al ponernos en contacto con nuestros socios de negocios, nos encargamos de averiguar qué es lo que
necesitan, qué les gustaría saber acerca de su negocio. Luego a través de una serie de pasos bien
delimitados convertimos estas necesidades de información en un esquema multidimensional (tablas de
dimensiones y tablas de hechos).
Para llevar a cabo este proceso, realizamos, entre otras, las siguientes acciones:
• Análisis de requerimientos.
• Selección de esquema multidimensional que más se adapte a las necesidades del usuario.
• Creación de la base de datos multidimensional.
• Testing.
• Documentación.
Herramientas:
Para la confección del Data Warehouse utilizamos la metodología HEFESTO:
Con respecto al almacenamiento del Data Warehouse, utilizamos preferentemente las siguientes
herramientas:
• MySQL.
• DB2 Express-C.
Además, contamos con experiencia acerca de los siguientes motores:
• MS SQL Server.
• IBM DB2.
• Oracle.
• Apache Derby.
• PostgreSQL.
3
Plataforma BI:
Introducción:
La Plataforma BI posibilita que los diferentes usuarios puedan acceder a la información necesaria de
manera distrubuida, a través de la utilización de herramientas a tal fin.
Detalle Técnico:
Debido a su carácter open source y su gran madurez, utilizamos principalmente las siguientes plataformas,
cada una de las cuales se adapta a soluciones específicas:
• Pentaho.
• OpenI.
Además, contamos con experiencia en las siguientes tecnologías:
• IBM DB2.
• Oracle Business Intelligence.
• MicroStrategy.
• IBM Cognos.
4
Herramientas de Consulta y Análisis:
Introducción:
Las herramientas de consulta y análisis son sistemas que permiten al usuario realizar la exploración de
datos del DW. Básicamente constituyen el nexo entre el depósito de datos y los usuarios.
A través de una interfaz gráfica amigable y una serie de simples pasos, el usuario genera las consultas que
serán procesadas en el Data Warehouse a fin de analizar la información, para obtener conocimiento.
Reporting:
Se han desarrollado muchas herramientas para la producción de consultas y reportes, que ofrecen a los
usuarios, a través de pantallas gráficas intuitivas, la posibilidad de generar informes avanzados y
detallados, del área de interés del negocio que se este analizando. El usuario solo debe seguir una serie de
simples pasos, por ejemplo, seleccionar opciones de un menú, presionar tal o cual botón para especificar
los elementos de datos, sus condiciones, criterios de agrupación y demás atributos que se consideren
significativos.
Detalle Técnico:
Para la creación de reportes, nos especializamos en la utilización de las siguientes herramientas open
source:
• Pentaho Metadata Editor.
• Pentaho Report Design.
• Eclipse BIRT.
• Pentaho Design Studio.
• Jasper Reports.
Análisis Interactivos:
Los Análisis Interactivos (OLAP), se utilizan para analizar información en línea, administración y ejecución
de consultas, que permiten inferir información del comportamiento del negocio.
Su principal objetivo es el de brindar rápidas respuestas a complejas preguntas, para interpretar la
situación del negocio y tomar decisiones. Cabe destacar, que lo realmente interesante en OLAP, no es la
ejecución de consultas tradicionales, sino la posibilidad de utilizar operadores, que por ejemplo permitan
analizar la información desde lo particular hacia lo general y viceversa, a fin de explotar profundamente la
información.
Además, a través de este tipo de herramientas, se puede analizar el negocio desde diferentes escenarios
históricos, reflejar su comportamiento y evolución en un ambiente multidimensional, o sea, mediante la
combinación de diferentes perspectivas, temas de interés o dimensiones. Esto permite deducir tendencias,
por medio del descubrimiento de relaciones entre las perspectivas que a simple vista no se podrían
encontrar.
Detalle Técnico:
Las herramientas que utilizamos en este caso son las siguientes:
• Mondrian Schema Workbench.
• Jpivot.
• Pentaho Design Studio.
• Mondrian.
5
Dashboards:
Los Dashboards se pueden entender como una colección de reportes, consultas y análisis interactivos que
hacen referencia a un tema en particular y que están relacionados entre sí.
Existen diversas maneras de diseñar un Dashboard, cada una de las cuales tiene sus objetivos particulares,
a modo de síntesis, se expondrán algunas características generales que suelen poseer:
• Presentan información altamente resumida.
• Se componen de consultas, reportes, análisis interactivos, gráficos (de torta, barras, etc),
semáforos, indicadores causa-efecto, etc.
• Permiten evaluar la situación de la empresa con un solo golpe de vista.
• Poseen un formato de diseño muy visual y son muy llamativos.
Detalle Técnico:
Para la creación de Dashboards utilizamos las siguientes herramientas open source:
• Community Dashboard Framework.
Pentaho Design Studio.
• Open Flash Chart.
• amCharts.
Fusion Charts.
JfreeChart.
Jpivot.
6