1. INSTITUTO TECNOLÓGICO SUPERIOR DE
FELIPE CARRILLO PUERTO
FUNDAMENTOS DE BASE DE DATOS
TRABAJO:
Investigación Unidad 4: Diseño De Base De Datos Relacional
DOCENTE:
Arizbé Del S. Arana Kantún
Felipe Carrillo Puerto Quintana Roo, a 19 de Abril del 2013
ELABORADO POR:
Yama May José Luis
SEMESTRE: 4
GRUPO: B
AULA: J-4
2. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 2
Contenido
INTRODUCCION................................................................................................................................... 3
UNIDAD 4: DISEÑO DE BASE DE DATOS RELACIONAL......................................................................... 4
4.1 CARACTERISTICAS DEL DISEÑO RELACIONAL................................................................................ 4
4.2 DOMINIOS ATOMICOS Y LA FORMA NORMAL.............................................................................. 5
Dominio Atómico. ........................................................................................................................... 5
Formas Normales ............................................................................................................................ 5
Primera Forma Normal (1FN).......................................................................................................... 5
4.3 DEPENDENCIAS FUNCIONALES...................................................................................................... 6
4.4 SEGUNDA FORMA NORMAL (2FN)................................................................................................ 7
4.5 TERCERA FORMA NORMAL (3FN). ................................................................................................ 8
4.6 FORMA NORMAL BOYCE-COD..................................................................................................... 10
4.7 ALGORITMOS DE DESCOMPOSICION. ......................................................................................... 10
4.8 FORMAS NORMALES SUPERIORES.............................................................................................. 11
Cuarta forma normal..................................................................................................................... 11
Quinta forma normal .................................................................................................................... 12
4.9 INTEGRIDAD DE LA BASE DE DATOS............................................................................................ 13
CONCLUSIÓN..................................................................................................................................... 14
BIBLIOGRAFÍA.................................................................................................................................... 15
3. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 3
INTRODUCCION
En este trabajo de investigación, podrá encontrar información básica acerca
de cada uno de los temas que forman parte de la unidad 4 Diseño de Base de
Datos Relacional de Fundamentos de base de datos. Información como
definiciones sobre cada uno de los conceptos que se manejaran en esta etapa del
diseño de una base de datos, características nuevas, terminologías de esta etapa
del proceso así como múltiples ejemplos acerca de cada uno de los temas y
aplicaciones que se pretenden se aprenda en esta unidad.
Para entrar en materia en esta fase, lo primero que encontrara será
definiciones acerca de las características del diseño de una base de datos
relacional, los términos centrales a aprenderse, para poder obtener el mayor grado
de aprendizaje posible sobre este atapa y así poderlo aplicar y ejecutar sobre
algún proyecto de creación de base de datos.
Posteriormente, tenemos la definición de lo que es un dominio atómico, que
no es nada más que información sobre algo o alguien en su forma más simple; a
partir de aquí ya se empieza a hablar sobre algo muy importante de esta parte del
desarrollo de una BD, que son las formas normales; que en este caso se incluye la
definición de una forma normal, para que posteriormente se explique cada una de
las seis diferentes formas normales válidas y utilizadas, para la eliminación de
errores dentro de una base de datos. Encontrará información a partir de la primera
hasta la tercera forma normal; notara que después de la tercera se habla de la
forma normal de Boyce Codd, que toma en cuenta las características de las
formas que la anteceden.
Luego de esto, se presentan los algoritmos de descomposición de los
cuales se incluyen unos pequeños conceptos, la forma de utilizarlos y además se
anexan algunos ejemplos que serán de utilidad para entender mejor de lo que se
tratan y para que nos van a servir en una BD.
Por último, se mencionan las formas normales superiores que están casi
ligadas a las formas normales, mencionadas anteriormente, además se habla un
poco sobre la integridad de la base de datos. Este término se maneja en esta
etapa, debido a que al utilizar las diferentes formas normales, realmente lo que se
busca es que la información que encuentre en nuestra base de datos no tenga
ningún tipo de inconvenientes en cuanto a su actualización o manipulación,
eliminando las redundancias e inconsistencias que en un momento dado pueden
presentarse en las etapas anteriores del proceso de diseño de la Base De Datos.
4. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 4
UNIDAD 4: DISEÑO DE BASE DE DATOS RELACIONAL
El diseño de una base de datos relacional consiste básicamente en generar
un conjunto de esquemas de relaciones que permitan almacenar la información
con un mínimo de redundancia, pero que a la vez facilite la recuperación de la
información almacenada en ella.
4.1 CARACTERISTICAS DEL DISEÑO RELACIONAL.
El modelo relacional para la gestión de una base de datos es un modelo de
datos basado en la lógica de predicados y en la teoría de conjuntos. Es el modelo
más utilizado en la actualidad para modelar problemas reales y administrar datos
dinámicamente.
En este modelo todos los datos son almacenados en relaciones, y como
cada relación es un conjunto de datos, el orden en el que éstos se almacenen no
tiene relevancia (a diferencia de otros modelos como el jerárquico y el de red).
Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar por
un usuario no experto. La información puede ser recuperada o almacenada por
medio de consultas que ofrecen una amplia flexibilidad y poder para administrar la
información.
Para manipular la información utilizamos un lenguaje relacional,
actualmente se cuenta con dos lenguajes formales el Álgebra relacional y el
Cálculo relacional. El Álgebra relacional permite describir la forma de realizar una
consulta, en cambio, el Cálculo relacional sólo indica lo que se desea devolver.
Esquema: Un esquema es la definición de una estructura (generalmente
relaciones o tablas de una base de datos), es decir, determina la identidad de la
relación y que tipo de información podrá ser almacenada dentro de ella.
Instancias: Una instancia de manera formal es la aplicación de un
esquema a un conjunto finito de datos. En palabras no tan técnicas, se puede
definir como el contenido de una tabla en un momento dado, pero también es
válido referirnos a una instancia cuando trabajamos o mostramos únicamente un
subconjunto de la información contenida en una relación o tabla.
5. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 5
4.2 DOMINIOS ATOMICOS Y LA FORMA NORMAL.
Dominio Atómico.
El dominio se refiere a todos los valores que se desprenden de un atributo o
que son legales o permitidos en la base de datos, y atómico significa indivisible, es
decir, cada atributo debe contener un único valor del dominio. Además, cada valor
debe tener un nombre único, ya que la creación de tablas implica la definición de
columnas de un tipo concreto y con un nombre único. Tampoco pueden existir
tuplas idénticas. Por ejemplo si un registro es modificado más de una vez el
mismo día, no deberá crearse un registro nuevo cada vez.
Formas Normales
Las formas normales son aplicadas a las tablas de una base de datos. Decir
que una base de datos está en la forma normal N es decir que todas sus tablas
están en la forma normal N. En general, las primeras tres formas normales son
suficientes para cubrir las necesidades de las bases de datos. El creador de estas
tres primeras formas normales o reglas de creación de una base de datos fue
Edgar F. Codd. Dichas formas normales se representan en un orden similar al que
se muestra en la siguiente figura.
Primera Forma Normal (1FN)
Aplicar la primera forma normal es muy simple, bastara con dividir cada
columna no atómica en tantas columnas atómicas como sea necesario. Por
ejemplo, si tenemos una relación que contiene la información de una agenda de
amigos con este esquema: Agenda(Nombre, Email)
El nombre normalmente, estará compuesto por el tratamiento (señor,
señora, don, doña, señorita, etc), el nombre en si de la persona y los apellidos.
Podríamos en este caso, considerar el nombre como un dato atomico, pero puede
interesarnos separar algunas de las partes que lo componen, por lo que podría
quedar de la siguiente forma:
Agenda (Nombre_Tratamiento, Nombre_Pila, Nombre_Apellidos, Email).
6. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 6
Por tanto, tenemos que:
Una tabla está en primera forma normal si:
Todos los atributos son atómicos.
La tabla contiene una clave primaria.
La clave primaria no contiene atributos nulos.
No existe variación en el número de columnas.
Los campos no clave deben de identificarse por la clave principal
(Dependencia Funcional).
Una tupla no puede tener múltiples valores de cada columna.
Esta forma normal elimina los valores repetidos dentro de una BD.
Por lo general la mayoría de las relaciones cumplen con estas características,
así que podemos decir que la mayoría de las relaciones se encuentran en la
primera forma normal. Para ejemplificar como se representan gráficamente las
relaciones en primera forma normal consideremos la relación alumno cursa
materia cuyo diagrama E-R es el siguiente:
Como esta relación maneja valores atómicos, es decir un solo valor por cada
uno de los campos que conforman a los atributos de las entidades, ya se
encuentra en primera forma normal, gráficamente así representamos a las
relaciones en 1FN.
4.3 DEPENDENCIAS FUNCIONALES.
Una dependencia funcional es una relación entre atributos de una misma
relación (tupla). Es decir, si X e Y son atributos de la relación R, se dice que Y es
funcionalmente dependiente de X (se denota por XY) si cada valor de X tiene
asociado un solo valor de Y (X e Y pueden constar de uno o varios atributos).
Cada dependencia funcional es una clase especial de regla de integridad y
representa una relación de uno a muchos.
7. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 7
Dependencia funcional mutua: ab y ba o lo que es lo mismo ab.
Nótese que el concepto de dependencia funcional no depende de la extensión
concreta (contenido) que en un momento determinado tenga la tabla sino
cualquier posible extensión que pudiera tener. Los atributos a y b pueden ser
simples o compuestos (formados por la agregación de varios atributos).
Reflexividad. A partir de cualquier atributo o conjunto de atributos siempre
puede deducirse el mismo.
Dependencia Trivial: xx.
Aumentatividad. Si XY entonces X+ZY. Así se puede aumentar
trivialmente el antecedente de una dependencia. Ejemplo: si con el DNI se
determina el nombre de una persona, entonces con el DNI más la dirección
también se determina el nombre.
Proyectividad. Si XY+Z entonces XY. ejemplo: si a partir del DNI es
posible deducir el nombre y la dirección de una persona, entonces con el DNI es
posible determinar el nombre.
Aditividad. Si XY y ZW entonces X+ZY+W. Ejemplo: si con el DNI se
determina el nombre y con la dirección se determina el teléfono de una persona,
entonces con el DNI y la dirección se puede determinar el nombre y el teléfono.
Transitividad o Enlace de Dependencias Funcionales. Si XY e YZ
entonces XZ. Ejemplo: si con el DNI puede determinarse el código postal de
residencia de la persona, y con este código puede determinarse el nombre de la
provincia, entonces con el DNI puede determinarse el nombre de la provincia. Este
es el mecanismo básico de funcionamiento del enlace entre tablas a partir de
claves ajenas.
4.4 SEGUNDA FORMA NORMAL (2FN).
Para definir formalmente la segunda forma normal requerimos saber que es
una dependencia funcional: Consiste en edificar que atributos dependen de otro(s)
atributo(s).
Definición formal: Una relación R está en 2FN si y solo si está en 1FN y los
atributos no primos dependen funcionalmente de la llave primaria.
Una relación se encuentra en segunda forma normal, cuando cumple con las
reglas de la primera forma normal y todos sus atributos que no son claves (llaves)
dependen por completo de la clave. De acuerdo con esta definición, cada tabla
que tiene un atributo único como clave, está en segunda forma normal.
8. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 8
La segunda forma normal se representa por dependencias funcionales
como:
Nótese que las llaves primarias están representadas con doble cuadro, las
flechas nos indican que de estos atributos se puede referenciar a los otros
atributos que dependen funcionalmente de la llave primaria.
4.5 TERCERA FORMA NORMAL (3FN).
Para definir formalmente la 3FN necesitamos definir dependencia transitiva: En
una afinidad (tabla bidimensional) que tiene por lo menos 3 atributos (A,B,C) en
donde A determina a B, B determina a C pero no determina a A.
Definición formal: Una relación R está en 3FN si y solo si está en 2FN y
todos sus atributos no primos dependen no transitivamente de la llave primaria.
Consiste en eliminar la dependencia transitiva que queda en una segunda forma
normal, en pocas palabras una relación está en tercera forma normal si está en
segunda forma normal y no existen dependencias transitivas entre los atributos,
nos referimos a dependencias transitivas cuando existe más de una forma de
llegar a referencias a un atributo de una relación.
Por ejemplo, consideremos el siguiente caso:
Tenemos la relación alumno-cursa-materia manejada anteriormente, pero ahora
consideramos al elemento maestro, gráficamente lo podemos representar de la
siguiente manera:
9. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 9
Podemos darnos cuenta que se encuentra graficado en segunda forma
normal, es decir que todos los atributos llave están indicados en doble cuadro
indicando los atributos que dependen de dichas llaves, sin embargo en la llave
Necono tiene como dependientes a 3 atributos en el cual el nombre puede ser
referenciado por dos atributos: Necono y RFC (Existe dependencia transitiva),
podemos solucionar esto aplicando la tercera forma normal que consiste en
eliminar estas dependencias separando los atributos, entonces tenemos:
10. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 10
4.6 FORMA NORMAL BOYCE-COD.
Determinante: Uno o más atributos que, de manera funcional, determinan otro
atributo o atributos. En la dependencia funcional (A,B)C, (A,B) son los
determinantes.
Definición formal: Una relación R está en FNBC si y solo si cada determinante
es una llave candidato.
Denominada por sus siglas en inglés como BCNF; Una tabla se considera
en esta forma si y sólo sí cada determinante o atributo es una llave candidato.
Continuando con el ejemplo anterior, si consideramos que en la entidad
alumno sus atributos control y nombre nos puede hacer referencia al atributo esp.,
entonces decimos que dichos atributos pueden ser llaves candidato.
Gráficamente podemos representar la forma normal de Boyce Codd de la
siguiente forma:
Obsérvese que a diferencia de la tercera forma normal, agrupamos todas las
llaves candidato para formar una global (representadas en el recuadro) las cuales
hacen referencia a los atributos que no son llaves candidato.
4.7 ALGORITMOS DE DESCOMPOSICION.
Algoritmo de descomposición 3FN también se denomina algoritmo de
síntesis de 3FN, ya que toma un conjunto de dependencias y añade los esquemas
uno a uno, en lugar de descomponer el esquema inicial de manera repetida.
Algoritmo de descomposición FNBC, Recibe como argumentos:
1. El conjunto de dependencias funcionales (DF)
2. La relación original (r)* calculamos f+ * si el esquema no está en FNBC, usamos
la primera DEP funcional de DF no trivial que cumpla que la parte izquierda no sea
clave candidata. Dividimos el esquema r en dos: por un lado creamos un esquema
cuyos atributos sean los de la dependencia funcional y le añadimos aquellas
dependencias funcionales de f+ que sólo involucren a esos atributos; y por otro
lado creamos otro esquema cuyos atributos son todos los de la relación.
El proceso es recursivo hasta que todos los esquemas estén en FNBC.
11. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 11
4.8 FORMAS NORMALES SUPERIORES.
Cuarta forma normal
Una tabla está en 4NF si y solo si está en Tercera forma normal o en BCNF
(Cualquiera de ambas) y no posee dependencias multivaluadas. Una tabla con
una dependencia multivaluada es una donde la existencia de dos o más relaciones
independientes muchos a muchos causa redundancia; y es esta redundancia la
que es suprimida por la cuarta forma normal.
Para entender mejor aún esto consideremos una afinidad (tabla) llamada
estudiante que contiene los siguientes atributos: Clave, Especialidad, Curso tal y
como se demuestra en la siguiente figura:
Clave Especialidad Curso
S01 Sistemas Natación
S01 Bioquímica Danza
S01 Sistemas Natación
B01 Bioquímica Guitarra
C03 Civil Natación
Suponemos que los estudiantes pueden inscribirse en varias especialidades y
en diversos cursos. En esta tabla o relación no existe dependencia funcional
porque los estudiantes pueden tener distintas especialidades, un valor único de
clave puede poseer muchos valores de especialidades al igual que de valores de
cursos. Por lo tanto existe dependencia de valores múltiples. Este tipo de
dependencias produce redundancia de datos, como se puede apreciar en la tabla
anterior, en donde la clave S01 tiene tres registros para mantener la serie de datos
en forma independiente lo cual ocasiona que al realizarse una actualización se
requiera de demasiadas operaciones para tal fin.
Para eliminar la redundancia de los datos, se deben eliminar las dependencias
de valores múltiples. Esto se logra construyendo dos tablas, donde cada una
almacena datos para solamente uno de los atributos de valores múltiples. Para
nuestro ejemplo, las tablas correspondientes son:
Tabla Eespecialidad
Clave Especialidad
S01 Sistemas
B01 Bioquímica
C03 Civil
12. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 12
Tabla ECurso
Clave Curso
S01 Natación
S01 Danza
B01 Guitarra
C03 Natación
Quinta forma normal
La quinta forma normal (5FN), también conocida como forma normal de
proyección-unión (PJ/NF), es un nivel de normalización de bases de datos
designado para reducir redundancia en las bases de datos relacionales que
guardan hechos multi-valores aislando semánticamente relaciones múltiples
relacionadas.
Definición formal: Un esquema de relaciones R está en 5FN con respecto a un
conjunto D de dependencias funcionales, de valores múltiples y de producto, si
para todas las dependencias de productos en D se cumple por lo menos una de
estas condiciones:
*(R1, R2, R3,... Rn) es una dependencia de producto trivial.
* Toda Ri es una superllave de R.
La quinta forma normal se refiere a dependencias que son extrañas. Tiene que
ver con tablas que pueden dividirse en subtablas, pero que no pueden
reconstruirse.
13. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 13
4.9 INTEGRIDAD DE LA BASE DE DATOS.
Integridad de datos en bases de datos: Integridad de datos se refiere al
estado de corrección y completitud de los datos ingresados en una base de datos.
Los SGBD relacionales deben ser capaces de mantener la integridad de los
datos almacenados en una base de datos con respecto a las reglas predefinidas o
restricciones que el administrador y creador de la base de datos determine.
Un claro ejemplo de error de integridad es el ingreso de un tipo de dato
incorrecto dentro de un campo. Por ejemplo, ingresar un texto cuando se espera
un número entero. También un error en la integridad de una base de datos puede
ser la existencia de un valor numérico (ID_Cliente) en la compra de un producto
por parte de un cliente que no existe en su correspondiente tabla con ese número.
(Integridad referencial).
La exigencia de integridad de los datos garantiza la calidad de los datos de
la base de datos. Por ejemplo, si se especifica para un empleado el valor de
identificador de 123, la base de datos no debe permitir que ningún otro empleado
tenga el mismo valor de identificador. Si tiene una columna employee_rating para
la que se prevean valores entre 1 y 5, la base de datos no debe aceptar valores
fuera de ese intervalo.
Dos pasos importantes en el diseño de las tablas son la identificación de
valores válidos para una columna y la determinación de cómo forzar la integridad
de los datos en la columna.
14. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 14
CONCLUSIÓN
Para terminar con este trabajo de investigación, sobre la unidad 4 de diseño
de base de datos relacional, no queda más que presentar una opinión acerca de lo
aprendido durante la realización de esta investigación, que es una etapa más, que
conlleva a aprender sobre la creación de bases de datos relacionales.
En este caso en concreto se hablo acerca de las formas normales que debe
tener un sistema de bases de datos, que consiste básicamente en buscar
optimizar lo mejor posible el funcionamiento de la BD, disminuyendo al mínimo o
eliminando por completo los posibles errores que en dado momento se pudieran
presentar durante la manipulación de la información que se almacene en este.
Aunque, las formas normales son un tema algo complicado de entender y de
aplicar a las bases de datos, es importante conocerlas y con esta investigación,
fue sencillo comprender lo mucho que ayuda aplicar las distintas formas normales
dentro de una base de datos.
Un punto sobresaliente, que permite comprender cuando aplicar una forma
normal u otra en una base de datos en específico, es conocer las características
básicas de la misma además de que dependerá mucho de su tamaño, es decir,
mientras más robusto sea la base de datos, será necesario aplicar cada una de las
formas normales, para lograr una mayor optimización, en contraste, si nuestra BD
es pequeña, solo usaremos las formas normales que determinemos conveniente.
Y algo muy importante dentro de un sistema que se utiliza para controlar una gran
cantidad de información, es mantener la integridad de este. En esta investigación
fue uno de los temas que abordamos y compartimos.
15. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 15
BIBLIOGRAFÍA
PAGINAS CONSULTADAS
http://es.scribd.com/doc/57712337/Fundamentos-de-Base-de-Datos-UNIDAD-4
www.isc.itcj.s5.com/bdd1/unidad4.htm
http://www.estructurayprogramacion.com/materias/fundamentos-de-base-de-
datos/caracteristicas-del-dise%C3%B1o-relacional/
http://es.scribd.com/doc/52384224/FORMAS-NORMALES-DE-UNA-BASE-DE-DATOS
http://es.wikipedia.org/wiki/Normalizaci%C3%B3n_de_bases_de_datos
http://www.unalmed.edu.co/~mstabare/Dep_fnal.htm
http://gemagutsan.wordpress.com/2011/03/18/16032011-normalizacion-y-dependencia-
funcional/
http://tareasfundamentosbditp.blogspot.mx/p/tarea-4-unidad-4.html
http://www.ecured.cu/index.php/Integridad_de_las_Bases_de_Datos
http://basesdedatostecpachuca.blogspot.mx/2012/11/tarea-iv-algoritmos-de-
descomposicion.html
http://www.estructurayprogramacion.com/materias/fundamentos-de-base-de-datos/algoritmos-
de-descomposicion/
16. Fundamentos de Base de Datos
U4 Diseño De Base De Datos Relacional Página 16