El documento describe la historia y desarrollo de las bases de datos desde los años 1950 hasta la actualidad. Comenzó con sistemas jerárquicos y de red en los años 1960-1970, luego se propuso el modelo relacional en 1970 que dio lugar a sistemas más flexibles e independientes físico-lógicamente como Oracle y SQL. El modelo relacional ahora predomina sobre los modelos anteriores debido a su enfoque matemático y lenguajes como SQL.
2. • La historia de las bases de datos inicia a mediados de los años
cincuenta, en el momento en que comenzaron a introducirse los
ordenadores para automatizar la gestión de las
empresas, fundamentalmente con desarrollos en COBOL, y se han
caracterizado por el uso de tecnologías orientadas a la
estructuración de datos mediante modelos jerárquicos y de lógica
procedimental, que obligan al programador a desplazarse registro a
registro, hecho que implica una escasa flexibilidad.
• En 1970 se propuso el modelo relacional, basado en los trabajos del
Dr. Codd, básicamente el modelo matemático que dio fundamentos
a la segunda generación de SGBD, caracterizada por una mayor
independencia físico-lógica, dado que actúan sobre conjuntos de
registros; entre ellas destacan
ORACLE, DB2, INGRES, INFORMIX, SYBASE, etc. Codd propuso un
modelo simple de datos en el que todos ellos se representarían en
tablas constituidas por filas y columnas. A dichas tablas se les dio en
nombre matemático de relaciones, denominándose así el sistema
como relaciona.
3. • Codd también propuso lenguajes para manipular los datos en las
tablas: álgebra y cálculo relacional, que soportan la manipulación
de los datos sobre la base de operadores lógicos en lugar de los
punteros físicos utilizados en los modelos jerárquicos y de red. El
resultado fue la aparición de sistemas relacionales durante la última
mitad de los setenta que soportaban lenguajes como el Structured
Query Language (SQL), el Query Language (Quel) y el Query-by-
Example(QBE): los trabajos de investigación que se realizaron
durante la década de los ochenta se centraron en la optimización de
consultas, lenguajes de alto nivel, teoría de la
normalización, organizaciones físicas para el almacenamiento de las
relaciones.
• El enfoque relaciona permite a los programadores la manipulación
de tuplas procedentes de distintos ficheros y tablas en una misma
base de datos mediante consultas estructuradas, habilitando
acciones múltiples sobre los registros. La aparición y
estandarización de SQL, permitió una mayor integración, multiplicó
las tareas asignadas a las bases de datos e implicó el desarrollo de
sistemas de uso transparente, cuya facilidad de manejo derivó en
una excepcional productividad e impresionante impacto económico
4. Base de datos jerárquica
• Una base de datos jerárquica es un tipo de sistema de gestión de bases de datos
que, almacenan la información en una estructura jerárquica que enlaza los registros en forma
de estructura de árbol, en donde un nodo padre de información puede tener varios nodos hijo.
• Esta relación jerárquica no es estrictamente obligatoria, de manera que pueden establecerse
relaciones entre nodos hermanos. En este caso la estructura en forma de árbol se convierte en
una estructura en forma de grafo dirigido. Esta variante se denomina Bases de datos de red.
• Las bases de datos jerárquicas fueron concebidas en los años 1960. El primer metamodelo de
base de datos propuesto fue la mencionada Base de datos en red, concebida bajo el auspicio
de CODASYL. Posteriormente se refinó la idea dando lugar a la base de datos jerárquica. La
primera implementación de este metamodelo fue IMS. Se trata de un diseño de IBM y otros
colaboradores en 1966.
• Poco después, en 1970, E. F. Codd propuso el modelo relacional. Las ventajas de este modelo y
su enfoque matemático centraron los esfuerzos de la industria dando lugar a los sistemas
gestores de bases de datos relacionales. Estos últimos han reemplazado a las bases de datos
jerárquicas hoy día, pero no completamente. La mayoría de las antiguas bases de datos
jerárquicas de bancos y Administraciones Públicas aún siguen en actividad. Esto se debe a que
el rendimiento de las bases de datos jerárquicas sigue sin ser superado por las bases de datos
relacionales. Además estos sectores sufren un gran volumen de transacciones. Observése, por
ejemplo, la cantidad de apuntes contables que requiere una red de cajeros automáticos en un
solo día.
5. Base de datos de red
• Una base de datos de red es una base de datos conformada por una
colección o set de registros, los cuales están conectados entre sí por
medio de enlaces en una red. El registro es similar al de una entidad
como las empleadas en el modelo relacional.
•
Un registro es una colección o conjunto de campos
(atributos), donde cada uno de los que contiene solamente un
único valor almacenado, exclusivamente el enlace es la asociación
entre dos registros, así que podemos verla como una relación
estrictamente binaria.
• Una estructura de base de datos de red, llamada algunas veces
estructura de plex, abarca más que la estructura de árbol, porque
un nodo hijo en la estructura red puede tener más de un nodo
padre. En otras palabras, la restricción de que en un árbol
jerárquico cada hijo puede tener sólo un padre, se hace menos
severa.
6. Modelo relacional
• El modelo relacional para la gestión de una base de datos es un modelo de datos basado en la
lógica de predicados y en la teoría de conjuntos. Es el modelo más utilizado en la actualidad
para modelar problemas reales y administrar datos dinámicamente. Tras ser postuladas sus
bases en 1970 por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos.
• Su idea fundamental es el uso de relaciones. Estas relaciones podrían considerarse en forma
lógica como conjuntos de datos llamados tuplas. Pese a que ésta es la teoría de las bases de
datos relacionales creadas por Edgar Frank Codd, la mayoría de las veces se conceptualiza de
una manera más fácil de imaginar, esto es, pensando en cada relación como si fuese una tabla
que está compuesta por registros (cada fila de la tabla sería un registro o tupla), y columnas
(también llamadas campos).
• Una base de datos relacional es un conjunto de una o más tablas estructuradas en registros
(líneas) y campos (columnas), que se vinculan entre sí por un campo en común, en ambos
casos posee las mismas características como por ejemplo el nombre de campo, tipo y longitud;
a este campo generalmente se le denomina ID, identificador o clave. A esta manera de
construir bases de datos se le denomina modelo relacional.
7. Las bases de datos relacionales pasan por un proceso al
que se le conoce como normalización de una base de
datos, el cual es entendido como el proceso necesario
para que una base de datos sea utilizada de manera
óptima.
Entre las ventajas de este modelo están:
• Garantiza herramientas para evitar la duplicidad de
registros, a través de campos claves o llaves.
• Garantiza la integridad referencial: Así al eliminar un
registro elimina todos los registros relacionados
dependientes.
• Favorece la normalización por ser más comprensible y
aplicable.