SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Puerto cabello, Junio del 2012
Existen algunas alternativas de
herramientas de software que permiten
la   administración,     monitoreo     y
balanceo de carga computacional en los
clusters de computadores personales.
Estas tareas específicas pueden ser
administradas con herramientas bien
conocidas, tales como: C3 (Cluster
Command & Control) y Ganglia, que
presentan funcionalidades para la
administración y monitoreo; Condor y
PBS (Portable Batch System), que
permiten la planificación, asignación de
recursos y tareas.
La operación de clusters requiere
de un manejo adecuado de los recursos
asociados. Los recursos del cluster deben
ser administrados adecuadamente para
que el administrador invierta la menor
cantidad de tiempo en detectar, investigar
y recuperar fallos de hardware y software,
y de este modo definir posibles medidas
de contingencia y tratar que el sistema
esté libre de errores. A su vez, estos pasos
permiten la adaptabilidad a los
requerimientos y cambios constantes que
se presentan en la manipulación de
tecnologías cluster, en cuanto se refiere al
hardware, software y al uso de ciertos
patrones de diseño.
El    administrador     de
un cluster debe tomar en cuenta
algunos aspectos, una vez que se ha
completado la instalación de los
recursos básicos de hardware y
software. Estos aspectos incluyen la
configuración e instalación de un
sistema de archivos universal, la
configuración y administración de
recursos mediante herramientas
implementadas en software; el
monitoreo de sus actividades y el
registro de cada uno de los eventos
generados por la ejecución de
cálculos computacionales.
Varios de los sistemas
                                 • Definición y administración de
más importantes para la          nodos.
instalación automática de        • Administración de colas por lotes
clusters,             incluyen   (Batch Queue Management).
herramientas de monitoreo,       • Administración de recursos: grupos
                                 NIS (Network Information Service),
administración y registro de
                                 cuotas de disco y CPU.
eventos mediante paquetes        • Administración de servicios de
de distribución para sistemas    resolución de nombres : DNS
Windows y Linux. Entre estos     (Domain Name
sistemas están OSCAR y           System para clusters)..
                                 • Registro de usuarios para clusters de
Rocks       NPACI;      ambos
                                 dimensiones superiores a los 100
sistemas permiten el uso de      nodos.
herramientas de software que     • Monitoreo de carga.
tienen propósitos específicos
tales como:
El manejo de logs, o el registro de eventos
generados tanto por el kernel del sistema
operativo, como por los diferentes servicios
que han sido habilitados para el
establecimiento de comunicación entre los
nodos, se lo puede realizar mediante
comandos del sistema operativo Linux para
poder visualizar los archivos de logs, o
utilizar herramientas de monitoreo tales
como:
• LogCheck
• Swatch
• LogSentry
• LogDog
El monitoreo permite conocer si todos los
componentes de hardware y software están
disponibles y operando de acuerdo a lo esperado.
Es decir, debe asegurarse que todos los
componentes de hardware estén disponibles
durante el arranque del sistema operativo (CPUs,
memoria, discos, dispositivos de red y otros), y de
igual forma, que todos los servicios de software,
tales como: planificadores de tareas,
administradores de recursos, y demonios de
monitoreo se ejecuten correctamente en el cluster.
Entre las herramientas de monitoreos se pueden
mencionar:
• Big Brother
• Cluemon
• Ganglia
• Nagios
• PARMON
• Supermon
La administración del cluster implica resolver
problemas provocados por fallos de hardware y/o software.
Los fallos causados por hardware pueden ocasionar que
el cluster quede inutilizable.
La recuperación ante fallos a nivel de hardware implica:
1. Aislar los componentes que fallaron para asegurar que
no causen un considerable impacto en las actividades
del cluster.
2. Manejar los componentes de respaldo (backup), para
poder hacer reemplazos y minimizar los efectos del fallo.
           Los fallos de componentes de software muchas
veces no tienen solución o forma de recuperación. Si se
considera que el sistema operativo está basado en Linux,
la mayor parte de aplicaciones requieren de parches o
nuevas versiones para mejorar o recuperarse de errores;
sin embargo, este proceso es muy complejo y conlleva
mucho tiempo. Por tal motivo, si un componente de
software falla lo único que resta por hacer es informar al
vendedor, diseñador o desarrollador de la apliación y
esperar por las mejoras.
Los ambientes Linux ofrecen
algunas alternativas para mantener copias de
un conjunto de archivos en varios equipos.
La forma más común y fácil de administrar
las copias de un conjunto de archivos
involucra la utilización de una red basada en
servicios para la administración de cuentas o
registros de usuario. Cuando se emplea esta
alternativa, cada computador realiza
consultas a un servicio central, el cual
maneja la autorización, la autenticación y la
información de los usuarios dentro del
sistema.
          Para la configuración manual
de clusters, los servicios más utilizados son
NIS (Network Information Service) o LDAP
(Lightweight Directory Access Protocol); sin
embargo; también se habilitan de forma
automática con los toolkits de OSCAR y
NPACI Rocks.
Las        actividades         de
administración y balanceo de carga que
son críticas para un entorno cluster son:
• Administrar la disponibilidad de los
nodos.
• Configurar atributos de los nodos que
sean importantes para balanceo de carga.
• Administrar usuarios y grupos mediante
cuotas de disco.
• Configurar y diseñar políticas.
• Administrar reservaciones y recursos
dedicados.
• Monitorear y generar un historial de
utilización de recursos para usuarios y
grupos.

Weitere ähnliche Inhalte

Ähnlich wie Diapositivas blog

Organizacion de los sistemas operativos
Organizacion de los sistemas operativosOrganizacion de los sistemas operativos
Organizacion de los sistemas operativosJoseGCordero
 
Diferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoDiferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoValdivia0312
 
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011ecuatareas
 
Administracion de datos
Administracion de datosAdministracion de datos
Administracion de datosUsein Gonzalez
 
Presentacion sistemas operativos
Presentacion sistemas operativosPresentacion sistemas operativos
Presentacion sistemas operativosPedro_Pizarro
 
Estructura de los Sistemas Operativos
Estructura de los Sistemas OperativosEstructura de los Sistemas Operativos
Estructura de los Sistemas OperativosMoisés Payares
 
Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Leo San Martin
 
Trabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-FTrabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-Fcrow123456
 
TRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOSTRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOScrisstthi
 
Actividades De Un Administrador De Red
Actividades De Un Administrador De RedActividades De Un Administrador De Red
Actividades De Un Administrador De RedGiova7910
 
Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159triujeque
 
Sistemas operativos - trabajo darwin
Sistemas operativos -  trabajo darwinSistemas operativos -  trabajo darwin
Sistemas operativos - trabajo darwindarwinjher
 
trabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinostrabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinosdarwinjher
 
Panel de control
Panel de controlPanel de control
Panel de controlequipo203
 
Actividad para evaluar el primer parcial
Actividad para evaluar el primer parcialActividad para evaluar el primer parcial
Actividad para evaluar el primer parcialcobaej plantel10
 

Ähnlich wie Diapositivas blog (20)

Nagios
Nagios Nagios
Nagios
 
Organizacion de los sistemas operativos
Organizacion de los sistemas operativosOrganizacion de los sistemas operativos
Organizacion de los sistemas operativos
 
Diferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoDiferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativo
 
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
 
Administracion de datos
Administracion de datosAdministracion de datos
Administracion de datos
 
Presentacion sistemas operativos
Presentacion sistemas operativosPresentacion sistemas operativos
Presentacion sistemas operativos
 
Estructura de los Sistemas Operativos
Estructura de los Sistemas OperativosEstructura de los Sistemas Operativos
Estructura de los Sistemas Operativos
 
Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02
 
Manual de word
Manual de wordManual de word
Manual de word
 
Trabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-FTrabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-F
 
Administrador de red
Administrador de redAdministrador de red
Administrador de red
 
TRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOSTRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOS
 
Actividades De Un Administrador De Red
Actividades De Un Administrador De RedActividades De Un Administrador De Red
Actividades De Un Administrador De Red
 
Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159
 
Sistemas operativos - trabajo darwin
Sistemas operativos -  trabajo darwinSistemas operativos -  trabajo darwin
Sistemas operativos - trabajo darwin
 
trabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinostrabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinos
 
Sistemas operativos 2
Sistemas operativos 2Sistemas operativos 2
Sistemas operativos 2
 
Panel de control
Panel de controlPanel de control
Panel de control
 
2 conceptos basicos
2 conceptos basicos2 conceptos basicos
2 conceptos basicos
 
Actividad para evaluar el primer parcial
Actividad para evaluar el primer parcialActividad para evaluar el primer parcial
Actividad para evaluar el primer parcial
 

Kürzlich hochgeladen

Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1ivanapaterninar
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armadob7fwtwtfxf
 
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docx
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docxPLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docx
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docxhasbleidit
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersIván López Martín
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptxHugoGutierrez99
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024u20211198540
 
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfcristianrb0324
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)JuanStevenTrujilloCh
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDAVIDROBERTOGALLEGOS
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdfBetianaJuarez1
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
 
La tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadLa tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadEduardoSantiagoSegov
 
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Marketing BRANDING
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
Análisis de Artefactos Tecnologicos (3) (1).pdf
Análisis de Artefactos Tecnologicos  (3) (1).pdfAnálisis de Artefactos Tecnologicos  (3) (1).pdf
Análisis de Artefactos Tecnologicos (3) (1).pdfsharitcalderon04
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerenciacubillannoly
 

Kürzlich hochgeladen (20)

Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armado
 
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docx
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docxPLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docx
PLANEACION DE CLASES TEMA TIPOS DE FAMILIA.docx
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 Testcontainers
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
 
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdf
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptx
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
 
La tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadLa tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedad
 
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
Análisis de Artefactos Tecnologicos (3) (1).pdf
Análisis de Artefactos Tecnologicos  (3) (1).pdfAnálisis de Artefactos Tecnologicos  (3) (1).pdf
Análisis de Artefactos Tecnologicos (3) (1).pdf
 
El camino a convertirse en Microsoft MVP
El camino a convertirse en Microsoft MVPEl camino a convertirse en Microsoft MVP
El camino a convertirse en Microsoft MVP
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerencia
 

Diapositivas blog

  • 2.
  • 3. Existen algunas alternativas de herramientas de software que permiten la administración, monitoreo y balanceo de carga computacional en los clusters de computadores personales. Estas tareas específicas pueden ser administradas con herramientas bien conocidas, tales como: C3 (Cluster Command & Control) y Ganglia, que presentan funcionalidades para la administración y monitoreo; Condor y PBS (Portable Batch System), que permiten la planificación, asignación de recursos y tareas.
  • 4. La operación de clusters requiere de un manejo adecuado de los recursos asociados. Los recursos del cluster deben ser administrados adecuadamente para que el administrador invierta la menor cantidad de tiempo en detectar, investigar y recuperar fallos de hardware y software, y de este modo definir posibles medidas de contingencia y tratar que el sistema esté libre de errores. A su vez, estos pasos permiten la adaptabilidad a los requerimientos y cambios constantes que se presentan en la manipulación de tecnologías cluster, en cuanto se refiere al hardware, software y al uso de ciertos patrones de diseño.
  • 5. El administrador de un cluster debe tomar en cuenta algunos aspectos, una vez que se ha completado la instalación de los recursos básicos de hardware y software. Estos aspectos incluyen la configuración e instalación de un sistema de archivos universal, la configuración y administración de recursos mediante herramientas implementadas en software; el monitoreo de sus actividades y el registro de cada uno de los eventos generados por la ejecución de cálculos computacionales.
  • 6. Varios de los sistemas • Definición y administración de más importantes para la nodos. instalación automática de • Administración de colas por lotes clusters, incluyen (Batch Queue Management). herramientas de monitoreo, • Administración de recursos: grupos NIS (Network Information Service), administración y registro de cuotas de disco y CPU. eventos mediante paquetes • Administración de servicios de de distribución para sistemas resolución de nombres : DNS Windows y Linux. Entre estos (Domain Name sistemas están OSCAR y System para clusters).. • Registro de usuarios para clusters de Rocks NPACI; ambos dimensiones superiores a los 100 sistemas permiten el uso de nodos. herramientas de software que • Monitoreo de carga. tienen propósitos específicos tales como:
  • 7.
  • 8. El manejo de logs, o el registro de eventos generados tanto por el kernel del sistema operativo, como por los diferentes servicios que han sido habilitados para el establecimiento de comunicación entre los nodos, se lo puede realizar mediante comandos del sistema operativo Linux para poder visualizar los archivos de logs, o utilizar herramientas de monitoreo tales como: • LogCheck • Swatch • LogSentry • LogDog
  • 9. El monitoreo permite conocer si todos los componentes de hardware y software están disponibles y operando de acuerdo a lo esperado. Es decir, debe asegurarse que todos los componentes de hardware estén disponibles durante el arranque del sistema operativo (CPUs, memoria, discos, dispositivos de red y otros), y de igual forma, que todos los servicios de software, tales como: planificadores de tareas, administradores de recursos, y demonios de monitoreo se ejecuten correctamente en el cluster. Entre las herramientas de monitoreos se pueden mencionar: • Big Brother • Cluemon • Ganglia • Nagios • PARMON • Supermon
  • 10. La administración del cluster implica resolver problemas provocados por fallos de hardware y/o software. Los fallos causados por hardware pueden ocasionar que el cluster quede inutilizable. La recuperación ante fallos a nivel de hardware implica: 1. Aislar los componentes que fallaron para asegurar que no causen un considerable impacto en las actividades del cluster. 2. Manejar los componentes de respaldo (backup), para poder hacer reemplazos y minimizar los efectos del fallo. Los fallos de componentes de software muchas veces no tienen solución o forma de recuperación. Si se considera que el sistema operativo está basado en Linux, la mayor parte de aplicaciones requieren de parches o nuevas versiones para mejorar o recuperarse de errores; sin embargo, este proceso es muy complejo y conlleva mucho tiempo. Por tal motivo, si un componente de software falla lo único que resta por hacer es informar al vendedor, diseñador o desarrollador de la apliación y esperar por las mejoras.
  • 11. Los ambientes Linux ofrecen algunas alternativas para mantener copias de un conjunto de archivos en varios equipos. La forma más común y fácil de administrar las copias de un conjunto de archivos involucra la utilización de una red basada en servicios para la administración de cuentas o registros de usuario. Cuando se emplea esta alternativa, cada computador realiza consultas a un servicio central, el cual maneja la autorización, la autenticación y la información de los usuarios dentro del sistema. Para la configuración manual de clusters, los servicios más utilizados son NIS (Network Information Service) o LDAP (Lightweight Directory Access Protocol); sin embargo; también se habilitan de forma automática con los toolkits de OSCAR y NPACI Rocks.
  • 12. Las actividades de administración y balanceo de carga que son críticas para un entorno cluster son: • Administrar la disponibilidad de los nodos. • Configurar atributos de los nodos que sean importantes para balanceo de carga. • Administrar usuarios y grupos mediante cuotas de disco. • Configurar y diseñar políticas. • Administrar reservaciones y recursos dedicados. • Monitorear y generar un historial de utilización de recursos para usuarios y grupos.