1. Características y tipos de bases de datos
Existe mucha información acerca de las bases de datos, por lo tanto, el objetivo de este
artículo no es hacerlo un experto en el tema sino solo ser una guía de los conceptos que
se manejan actualmente, conocer brevemente las características de las bases de datos y
las soluciones que existen hoy en día.
El modelo de base de datos jerárquica
El modelo jerárquico de bases de datos se asemeja a la estructura de un árbol, tal como
Microsoft Windows organiza las carpetas y archivos. En un modelo jerárquico de bases
de datos, cada enlace es anidado con el fin de conservar los datos organizados en un orden
particular en un mismo nivel de lista. Por ejemplo, una base de datos jerárquico de ventas,
puede incluir las ventas de cada día como un archivo separado. Anidadas dentro de este
archivo están todas las ventas (el mismo tipo de datos) para el día.
Modelo de Red
En un modelo de red, la característica definitoria es que se almacena un registro con un
enlace a otros registros - en efecto,una red.
Estas redes (o, a veces, a que se refiere como punteros) puede ser una variedad de
diferentes tipos de información como números de nodo de un disco o incluso la dirección.
2. ¿Qué es una base de datos?
De una manera simple, es un contenedor que permite almacenar la información de forma
ordenada con diferentes propósitos y usos. Por ejemplo, en una base de datos se puede
almacenar información de diferentes departamentos (Ventas, Recursos Humanos,
Inventarios, entre otros). El almacenamiento de la información por sí sola no tiene un
valor, pero si combinamos o relacionamos la información con diferentes departamentos
nos puede dar valor. Por ejemplo, combinar la información de las ventas del mes de junio
del 2014 para el producto ‘X’ en la zona norte nos da un indicativo del comportamiento
de las ventas en un periodo de tiempo.
Tipos de bases de datos
Existen muchas empresas con diferentes giros y dependiendo del giro será el tipo de
procesamiento que se le dará a la información, esto determinará el tipo de base de datos
a utilizar. Existen diferentes tipos de bases de datos pero las más comunes son las OLTP
y OLAP.
3. Las bases de datos de tipo OLAP (On Line Analytical Processing) también son llamadas
bases de datos estáticas lo que significa que la información en tiempo real no es afectada,
es decir, no se insertan, no se eliminan y tampoco se modifican datos; solo se realizan
consultas sobre los datos ya existentes para el análisis y toma de decisiones. Este tipo de
bases de datos son implementadas en Business Intelligence para mejorar el desempeño
de las consultas con grandes volúmenes de información.
4. La necesidad de implementar un tipo u otro dependerá del giro y necesidades de cada
empresa. Es muy importante identificar el tipo de base de datos que se requiere antes de
implementar un manejador de base de datos. Por ejemplo podemos citar al manejador de
base de datos “DB2 10.5 with BLU Acceleration”, la cual proporciona una solución para
la parte transaccional y para la parte de analíticos.
Tipo de información que se puede almacenar
Cuando surgen las bases de datos el tipo de información que se podía almacenar era de
tipo estructurada. La información es almacenada en un objeto llamado “Tabla” la cual
nos permite organizar la información. Por ejemplo, la tabla de “Empleados” contiene
información relacionada al #Empleado, Nombre, Apellido, #Seguro Social, etc. Cada uno
de estos elementos en una base de datos recibe el nombre de “Campo” y el conjunto de
estos elementos recibe el nombre de “Registro” (También llamado Columna y Renglón,
Hilera o Fila).
5. Los tipos de datos que se pueden almacenar son diversos, pero los más comunes son de
tipo Numérico, Decimales y tipo Texto. Conforme han evolucionado las bases de datos
se han expandido los tipos de datos que pueden almacenar. Por mencionar algunos tipos
están los CLOB (Character Large Object) y BLOB (Binary Large Object). Los CLOB
son utilizados para almacenar documentos y los BLOB para almacenar una imagen o
video.
¿Qué es HADR?
Sus siglas en inglés significan High Availability Disaster Recovery. Es una característica
de replicación de datos que brinda una solución de Alta Disponibilidad cuando surge una
falla parcial o total en uno de los servidores principales. Es una solución que soporta un
6. Servidor como Primario y hasta tres Servidores como Secundarios. Si el servidor primario
falla, uno de los servidores secundarios tomará el control y pasará a ser ahora el servidor
primario. La replicación de la información se hace a través de los archivos log de
transacciones.
Ventajas
• Minimiza el impacto de interrupciones planeadas y no planeadas.
• Permite la actualización del software sin interrumpir la operación.
• Para el aplicativo es transparente, no se requiere modificar la aplicación.
• No se requiere Hardware especializado.
• Fácil administración y configuración.
¿Qué es PureScale?
Es una arquitectura basada en Clúster. Un Clúster es un conjunto de varios ordenadores
unidos por una red de alta velocidad, de tal forma que es visto como un solo computador
más potente. Es una característica de DB2 que reduce el riesgo y los costos del
7. crecimiento del negocio al proporcionar capacidad extrema, disponibilidad continua y
transparencia para el aplicativo. Capacidad extrema significa que puede crecer su sistema
como sea necesario.
Ventajas
• Evita riesgos y costos en cambios a la aplicación.
• Diseñado para sistemas que requieren de disponibilidad continua (24×7). Si uno
o varios miembros fallan, la transacción y operación del sistema continúan.
• Utiliza la misma arquitectura del indiscutible estándar de Oro, los Sistemas Z.
• Agrega o quita miembros de una manera fácil.
• No se requiere tunear la infraestructura de la base de datos.
• Balanceo automático de cargas de trabajo.
• Construido y disponible en Power Systems y servidores System x.
• El núcleo del sistema es una arquitectura de disco compartido.
8. ¿Qué es DPF (Data Partitioning Feature)?
Es una característica de DB2, la cual permite hacer el particionamiento de base de datos.
Con esta característica se mejora el desempeño y la escalabilidad de grandes bases de
datos. Cuando existen grandes volúmenes de información en una base de datos, esta es
una de las soluciones a implementar. Cada partición de base de datos tiene su propio
conjunto de recursos informáticos incluyendo CPU, Memoria y unidades de
almacenamiento. En un ambiente DPF los registros de cada tabla son distribuidos en las
diferentes particiones (DB2 utiliza un algoritmo para determinar en qué partición deberá
estar la información). DPF es una característica de escalabilidad.
DPF acepta diferentes configuraciones:
1. Discos compartidos.
2. Discos dedicados.
3. Permite el uso de particiones lógicas y físicas.
4. Los comandos para la administración de la base de datos son ejecutados en cada
una de las particiones de forma automática y transparente.
5. Es transparente para el aplicativo.
9. ¿Qué es Table Partitioning?
Es el mismo concepto que DPF solo que esto aplica para tablas dentro de una base de
datos, es decir, es el particionamiento de los datos de una tabla en un subconjunto de
datos. En la mayoría de los casos las bases de datos conservan información de muchos
años atrás (históricos) lo que provoca que al ejecutar consultas sobre esa tabla el
desempeño se vea afectado y el consumo de los recursos sea mucho mayor.
¿Qué es MDC (Multi-Dimension Clustering)?
Proporciona un método elegante para permitir que los datos de una tabla puedan ser
agrupados físicamente en varias dimensiones simultáneamente de una manera flexible y
automática. Esto puede mejorar mucho el desempeño de las consultas.
Ventajas
10. • Reduce el gasto de mantenimiento en los datos tales como reorganizaciones y
mantenimiento de índices durante la creación, eliminación y actualización de
datos.
• Pensado inicialmente para Data Warehouse y bases de datos con grandes
volúmenes de información, pero también puede ser utilizado en bases de datos de
tipo OLTP.
IBM Informix – Base de datos inteligente para IoT
IBM Informix es una base de datos inteligente para resolver los problemas de IoT. Sus
características únicas le permiten que funcione en dispositivos periféricos y también en
la Nube. En la Nube, Informix tiene la escalabilidad y el rendimiento para servir como
plataforma de análisis avanzados que consolidan la información de millones de
dispositivos.
11. Conclusión:
El tema de bases de datos es muy amplio de explorar y difícil de seleccionar cuál es la
mejor arquitectura a utilizar. Normalmente se separan las bases de datos para operaciones
Transaccionales y para Analíticos. Es necesario hacer un buen análisis del tipo de
operación que se va a ejecutar en la base de datos para poder elegir la arquitectura más
adecuada y así realizar un buen uso de las capacidades de las bases de datos para obtener
los mejores resultados.
Referencias:
DB2 with BLU Acceleration
DB2 PureScale
DB2 High Availability
Data Warehouse Analytics
Big Data and Analytics
PureSystem