El documento describe las características y componentes principales de Oracle, una base de datos relacional escalable. Explica que Oracle consta de archivos de datos, redo log y de control, e incluye procesos como DBWn, LGWR, SMON y PMON que gestionan la escritura y recuperación de datos. También describe la estructura lógica y física de una base de datos Oracle, incluyendo el área global del sistema y de programas en memoria.
1. UNIVERSIDAD ISRAEL Área Informática CARRERA SISTEMAS INFORMÁTICOS Modalidad de Estudios a Distancia MED BASES DE DATOS ESTUDIANTE: Edgar Vinicio solano L. CICLO:Noveno FECHA: 17 de Octubre 2010 2011
2. ORACLE Oracle es una base de datos de objetos relacionales escalable y fácil de gestionar. Las siguientes opciones proporcionan una funcionalidad. Particionamiento: Proporciona utilidades para implementar aplicaciones de gran tamaño y escalables. Permite controlar las tablas y los índices con un nivel de granularidad inferior al que sería posible con la versión básica de Enterprise Edición. Real Application Clusters: Mejora la escalabilidad y disponibilidad de una base de datos, ya que permite que múltiples instancias del software de Oracle accedan a una única base de datos. Paquetes de Oracle Enterprise Manager: Están creados sobre Oracle Enterprise Manager. Los paquetes de Oracle Enterprise Manager Diagnostics, Tuning y Change Management son programas complementarios que proporcionan a los administradores un juego de herramientas para una gestión de cambios, un ajuste, un control y un diagnóstico avanzados de los entornos de Oracle. Seguridad avanzada: Proporciona seguridad de red de servidor a servidor y de cliente a servidor mediante el cifrado y la comprobación de la integridad de datos, y soporta servicios de autenticación de usuario mejorados con servicios de seguridad de terceros.
5. Oracle Server: Existen varios archivos, procesos y estructuras de memoria en Oracle Server, cuando se procesa una sentencia SQL no se utilizan todos. Algunos se utilizan para mejorar el rendimiento de la base de datos, asegurar la recuperación de la base de datos si se produce un error de software o de hardware, o realizar otras tareas necesarias para mantener la base de datos. Instancia Oracle: Una instancia Oracle es la combinación de los procesos en segundo plano y las estructuras de memoria. Es necesario iniciar la instancia para acceder a los datos de la base de datos. Cada vez que se inicia una instancia, se asigna un SGA (Área Global del Sistema) y se inician los procesos en segundo plano de Oracle.
6. Base de datos Oracle: Una base de datos está formada por archivos del sistema operativo, también llamados archivos de base de datos, que proporcionan el almacenamiento físico real para la información de la base de datos. Procesos de usuario y de servidor: Los procesos de usuario y de servidor son los procesos principales implicados en la ejecución de una sentencia SQL. Otros archivos clave: Los archivos que no son de base de datos se utilizan para configurar la instancia, autenticar los usuarios con privilegios y recuperar la base de datos en caso de que se produzca un fallo de disco.
7. Establecimiento de una Conexión y Creación de una Sesión Para que los usuarios puedan ejecutar sentencias SQL en una base de datos Oracle, se deben conectar a una instancia. • El usuario inicia una herramienta como SQL*Plus, o bien ejecuta una aplicación que se haya desarrollado con una herramienta como Oracle Forms. Esta aplicación se ejecuta como un proceso de usuario. • En la configuración más básica, cuando un usuario se conecta a Oracle Server, se crea un proceso en el equipo que ejecuta Oracle Server. A este proceso se le llama proceso de servidor. El proceso de servidor se comunicará con la instancia Oracle en nombre del proceso de usuario en el cliente.
8.
9. BASES DE DATOS ORACLE Una base de datos Oracle tiene una estructura lógica y una física. Una base de datos Oracle consta de tres tipos de archivos. • Los archivos de datos que contienen los datos reales de la base de datos • Los archivos redo log que contienen un registro de los cambios efectuados en la base de datos para activar la recuperación de los datos en caso de fallos • Los archivos de control que contienen la información necesaria para mantener y verificar la integridad de la base de datos
10. Estructura Física La estructura física incluye tres tipos de archivos: • Archivos de control • Archivos de datos • Archivos redo log online Estructura de la memoria La estructura de la memoria de Oracle está formada por dos áreas de memoria llamadas: • SGA (Área Global del Sistema): Asignada al iniciar la instancia y componente fundamental de una instancia Oracle • PGA (Área Global de Programas): Asignada al iniciar el proceso de servidor
11. Área Global del Sistema El área SGA está formada por varias estructuras de la memoria: – Conjunto Compartido – Caché de Buffers de Base de Datos – Buffer de Redo Log SGA Dinámica A partir de Oracle9i, el área SGA dinámica implementa una infraestructura que permite modificar la configuración del SGA sin cerrar la instancia. Asimismo, esto permite modificar el tamaño de la caché de buffers de base de datos, del conjunto compartido y del conjunto grande sin cerrar la instancia. En principio, se podría subconfigurar la caché de buffers de base de datos y el conjunto compartido, que podrían aumentar y reducirse posteriormente en función de sus respectivas cargas de trabajo, hasta un máximo especificado por SGA_MAX_SIZE. Especificación del Tamaño del SGA El tamaño del área SGA lo determinan varios parámetros de inicialización. DB_CACHE_SIZE: El valor por defecto es de 48 MB para UNIX y 52 MB para NT. LOG_BUFFER: Número de bytes asignados al buffer de redo log SHARED_POOL_SIZE: El valor por defecto es 16 MB. Si se trata de 64 bits, el tamaño por defecto es de 64 MB. LARGE_POOL_SIZE: El valor por defecto es cero JAVA_POOL_SIZE: El valor por defecto es 24 MB.
12. Área Global del Sistema Esta área es dinámica, su tamaño definido por el parámetro SGA_MAX_SIZE, asignada y con seguimiento en gránulos por componentes del SGA Unidad de Asignación Un gránulo es una unidad de asignación de memoria virtual contigua. El tamaño de un gránulo depende del tamaño del SGA total estimado cuyo cálculo se basa en el valor del parámetro SGA_MAX_SIZE. • 4 MB si el tamaño del SGA estimado es < 128 MB • 16 MB, en caso contrario Shared pool - Conjunto compartido
13. Se utiliza para almacenar: – Las últimas sentencias SQL ejecutadas – Las últimas definiciones de datos utilizadas Se encuentra formado por dos estructuras de memoria clave relacionadas con el rendimiento: – Caché de Biblioteca – Caché del Diccionario de Datos Library cache - Caché de Biblioteca Permite almacenar información acerca de las sentencias SQL y PL/SQL utilizadas más recientemente, también permite compartir las sentencias utilizadas con mayor frecuencia, esto se lo realiza por medio de un algoritmo LRU Está formado por dos estructuras: – Área de SQL compartido – Área de PL/SQL compartido Data Diccionary cache - Caché del Diccionario de Datos En este espacio de memoria se almacena el conjunto de las definiciones utilizadas más recientemente en la base de datos, dentro de ellas incluye información acerca de archivos de base de datos, tablas, índices, columnas, usuarios, privilegios y otros objetos de base de datos.
14. Especificación del Tamaño del Diccionario de Datos El tamaño total depende del tamaño del conjunto compartido y lo gestiona de forma interna la base de datos. Si la caché del diccionario de datos es demasiado pequeña, la base de datos tiene que consultar las tablas del diccionario de datos repetidas veces para obtener la información que necesita el servidor. Database buffer cache - Caché de Buffers de Base de Datos. En este espacio de memoria se almacena copias de bloques de datos que se han recuperado de archivos de datos lo que permite grandes mejoras de rendimiento al obtener y actualizar datos.
15. Redo log buffer - Buffer de RedoLog En este espacio se registra todos los cambios realizados en los bloques de datos de la base de datos, su finalidad principal es la recuperación, los cambios registrados dentro de éste se llaman registros de redo Especificación del Tamaño del Buffer de Redo Log El tamaño del buffer de redo log está definido por el parámetro de inicialización LOG_BUFFER.
16. Copia de Seguridad y Recuperación. RMAN (Oracle Recovery Manager) utiliza el conjunto grande cuando se definen los parámetros BACKUP_DISK_IO=n y BACKUP_TAPE_IO_SLAVE= TRUE. Si se ha configurado el conjunto grande, pero no tiene el tamaño suficiente, fallará la asignación de la memoria del conjunto grande. RMAN escribe un mensaje de error en el archivo log de alertas y no utiliza esclavos de E/S para copias de seguridad o restauración. Área Global de Programas Esta memoria está reservada para cada proceso de usuario que se conecte a una base de datos Oracle, se asigna cuando se crea un proceso y se libera cuando se termina un proceso, sólo la utiliza un proceso.
17.
18.
19. Estructura de Procesos Oracle se beneficia de varios tipos de procesos: • Procesos de usuario: Se inician cuando un usuario de base de datos solicita una conexión a Oracle Server • Procesos de servidor: Se conectan a la instancia Oracle y se inician cuando un usuario establece una sesión. • Procesos en segundo plano: Se inician al iniciar una instancia Oracle
20. Procesos de Usuario Programa que solicita interacción con Oracle Server, donde se debe establecer primero una conexión y que no interactúa directamente con Oracle Server. Procesos de Servidor Son Programas que interactúan directamente con Oracle Server, que cumplen las llamadas generadas y devuelven resultados
21. Una vez que el usuario ha establecido una conexión, se inicia un proceso de servidor para gestionar las solicitudes de los procesos de usuario. Un proceso de servidor puede ser de dos tipos: un proceso de servidor dedicado o un proceso de servidor compartido. En un entorno de Servidor dedicado, el proceso de servidor gestiona la solicitud de un único proceso de usuario. Una vez que el proceso de usuario se desconecta, el proceso de servidor termina. En un entorno de servidor compartido, el proceso de servidor gestiona la solicitud de varios procesos de usuario. DBWn (Escritor de Base de Datos)
22. DBWn : • Se produce un punto de control • Los buffers sucios alcanzan el umbral • No hay ningún buffer libre • Se produce un timeout • Se realiza un solicitud de sondeo RAC • Tablespace OFFLINE • Tablespace READ ONLY • Tabla DROP o TRUNCATE • Tablespace BEGIN BACKUP DBWn aplaza la escritura en los archivos de datos hasta que se produce uno de los siguientes eventos: • Punto de control normal o incremental. • El número de buffers sucios alcanza un valor umbral. • Se produce un timeout. • Se produce una solicitud de sondeo en un entorno RAC (Real ApplicationClusters). • Se coloca un tablespace normal o temporal offline • Se coloca un tablespace en modo de sólo lectura • Borrado o truncamiento de una tabla • ALTER TABLESPACE nombre del tablespace BEGIN BACKUP
23. LGWR (Escritura de Logs) LGWR realiza escrituras secuenciales desde el buffer de redo log al archivo redo log en las siguientes situaciones: • Cuando se valida una transacción. • Cuando existe más de un megabyte de cambios en el buffer de redo log. • Antes de que DBWn escriba los bloques modificados de la caché de buffers de base de datos en los archivos de datos. • Cada tres segundos.
24.
25. Abre la base de datos para que acceda el usuario.
26. Deshace las transacciones no validadas. • Fusiona el espacio libre • Libera los segmentos temporales
27. PMON (Monitor de Procesos) Hace una limpieza cuando los procesos han fallado: • Haciendo un rollback en las transacciones • Liberando los bloqueos • Liberando otros recursos • Reiniciando distribuidores interrumpidos El proceso PMON realiza una limpieza después de los procesos fallidos • Realizando rollback en la transacción actual del usuario • Liberando todos los bloqueos de tablas o filas actuales • Liberando otros recursos que están reservados en ese momento por el usuario • Reiniciando distribuidores interrumpidos
28. CKPT (Punto de Control) Responsable de: • Señalar a DBWn en los puntos de control • Actualizar las cabeceras de archivos de datos con información del punto de control • Actualizar los archivos de control con información del punto de control Cada tres segundos, el proceso CKPT almacena datos en el archivo de control para identificar el punto del archivo redo log online en el que se debe iniciar la recuperación, que se llama punto de control. El objetivo de un punto de control es garantizar que todos los buffers de la caché de buffers de base de datos que se han modificado antes de un punto en el tiempo se hayan escrito en los archivos de datos.
29. ARCn (Archiver) Proceso opcional en segundo plano • Archiva automáticamente archivos redo log online si está definido el modo ARCHIVELOG • Protege el registro contra todos los cambios realizados en la base de datos ARCn es un proceso en segundo plano opcional, no obstante, es crucial para recuperar una base de datos después de la pérdida de un disco. Cuando se llena un archivo redo log online, Oracle Server comienza a escribir en el siguiente. El proceso de cambio de un archivo redo log online a otro se llama cambio de log
30. Estructura Lógica. Establece el modo de uso del espacio físico de una base de datos respetando la Jerarquía formada por tablespaces, segmentos, extensiones y bloques Existe la siguiente jerarquía de estructuras lógicas: • Una base de datos Oracle contiene como mínimo un tablespace. • Un tablespace contiene uno o más segmentos. • Cada segmento está formado por extensiones. • Una extensión está formada por bloques lógicos. • Un bloque es la unidad más pequeña para las operaciones de lectura y escritura.
31. Tablespaces Los datos de una base de datos Oracle se almacenan en tablespaces. • Una base de datos Oracle se puede agrupar de forma lógica en áreas lógicas más pequeñas de espacio conocidas como tablespaces. • Un tablespace sólo puede pertenecer a una base de datos a la vez. • Cada tablespace está formado por uno o más archivos del sistema operativo, que reciben el nombre de archivos de datos. • Un tablespace puede tener uno o más segmentos. • Los tablespaces se pueden poner en línea mientras se está ejecutando la base de datos. • Excepto en el caso del tablespace SYSTEM o un tablespace con un segmento de deshacer activo. • Los tablespaces pueden cambiar entre un estado de lectura y escritura y de sólo lectura.
32. Archivos de Datos (Estructura No Lógica): Cada tablespace de una base de datos Oracle está formado por uno o más archivos llamados archivos de datos. • Un archivo de datos sólo puede pertenecer a un tablespace. • Oracle Server crea un archivo de datos para un tablespace asignando la cantidad especificada de espacio en disco más una pequeña cantidad de sobrecarga. • El administrador de la base de datos puede cambiar el tamaño de un archivo de datos una vez creado, o bien puede especificar que un archivo debería aumentar dinámicamente a medida que aumentan los objetos en el tablespace.
33.
34. A medida que el segmento va creciendo, se le agregan extensiones.
35. El DBA puede agregar extensiones a un segmento manualmente. • Una extensión es un juego de bloques Oracle contiguos. • Una extensión no puede abarcar archivos de datos y, por tanto, debe existir en un archivo de datos.
36. Bloques de Datos Oracle Server gestiona el espacio de almacenamiento de los archivos de datos en unidades llamadas bloques Oracle o bloques de datos. • Los bloques de datos Oracle son las unidades de almacenamiento más pequeñas que Oracle Server puede asignar, leer o escribir. • Un bloque de datos se corresponde con uno o más bloques del sistema operativo asignados desde un archivo de datos existente. • El tamaño de bloque de datos estándar de cada base de datos Oracle lo especifica el parámetro de inicialización DB_BLOCK_SIZE cuando se crea la base de datos. • El tamaño del bloque de datos debería ser múltiplo del tamaño del bloque del sistema operativo para evitar operaciones de E/S innecesarias. • El tamaño máximo del bloque de datos depende del sistema operativo.