SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Puerto cabello, Junio del 2012
Existen algunas alternativas de
herramientas de software que permiten
la   administración,     monitoreo     y
balanceo de carga computacional en los
clusters de computadores personales.
Estas tareas específicas pueden ser
administradas con herramientas bien
conocidas, tales como: C3 (Cluster
Command & Control) y Ganglia, que
presentan funcionalidades para la
administración y monitoreo; Condor y
PBS (Portable Batch System), que
permiten la planificación, asignación de
recursos y tareas.
La operación de clusters requiere
de un manejo adecuado de los recursos
asociados. Los recursos del cluster deben
ser administrados adecuadamente para
que el administrador invierta la menor
cantidad de tiempo en detectar, investigar
y recuperar fallos de hardware y software,
y de este modo definir posibles medidas
de contingencia y tratar que el sistema
esté libre de errores. A su vez, estos pasos
permiten la adaptabilidad a los
requerimientos y cambios constantes que
se presentan en la manipulación de
tecnologías cluster, en cuanto se refiere al
hardware, software y al uso de ciertos
patrones de diseño.
El    administrador     de
un cluster debe tomar en cuenta
algunos aspectos, una vez que se ha
completado la instalación de los
recursos básicos de hardware y
software. Estos aspectos incluyen la
configuración e instalación de un
sistema de archivos universal, la
configuración y administración de
recursos mediante herramientas
implementadas en software; el
monitoreo de sus actividades y el
registro de cada uno de los eventos
generados por la ejecución de
cálculos computacionales.
Varios de los sistemas
                                 • Definición y administración de
más importantes para la          nodos.
instalación automática de        • Administración de colas por lotes
clusters,             incluyen   (Batch Queue Management).
herramientas de monitoreo,       • Administración de recursos: grupos
                                 NIS (Network Information Service),
administración y registro de
                                 cuotas de disco y CPU.
eventos mediante paquetes        • Administración de servicios de
de distribución para sistemas    resolución de nombres : DNS
Windows y Linux. Entre estos     (Domain Name
sistemas están OSCAR y           System para clusters)..
                                 • Registro de usuarios para clusters de
Rocks       NPACI;      ambos
                                 dimensiones superiores a los 100
sistemas permiten el uso de      nodos.
herramientas de software que     • Monitoreo de carga.
tienen propósitos específicos
tales como:
El manejo de logs, o el registro de eventos
generados tanto por el kernel del sistema
operativo, como por los diferentes servicios
que han sido habilitados para el
establecimiento de comunicación entre los
nodos, se lo puede realizar mediante
comandos del sistema operativo Linux para
poder visualizar los archivos de logs, o
utilizar herramientas de monitoreo tales
como:
• LogCheck
• Swatch
• LogSentry
• LogDog
El monitoreo permite conocer si todos los
componentes de hardware y software están
disponibles y operando de acuerdo a lo esperado.
Es decir, debe asegurarse que todos los
componentes de hardware estén disponibles
durante el arranque del sistema operativo (CPUs,
memoria, discos, dispositivos de red y otros), y de
igual forma, que todos los servicios de software,
tales como: planificadores de tareas,
administradores de recursos, y demonios de
monitoreo se ejecuten correctamente en el cluster.
Entre las herramientas de monitoreos se pueden
mencionar:
• Big Brother
• Cluemon
• Ganglia
• Nagios
• PARMON
• Supermon
La administración del cluster implica resolver
problemas provocados por fallos de hardware y/o software.
Los fallos causados por hardware pueden ocasionar que
el cluster quede inutilizable.
La recuperación ante fallos a nivel de hardware implica:
1. Aislar los componentes que fallaron para asegurar que
no causen un considerable impacto en las actividades
del cluster.
2. Manejar los componentes de respaldo (backup), para
poder hacer reemplazos y minimizar los efectos del fallo.
           Los fallos de componentes de software muchas
veces no tienen solución o forma de recuperación. Si se
considera que el sistema operativo está basado en Linux,
la mayor parte de aplicaciones requieren de parches o
nuevas versiones para mejorar o recuperarse de errores;
sin embargo, este proceso es muy complejo y conlleva
mucho tiempo. Por tal motivo, si un componente de
software falla lo único que resta por hacer es informar al
vendedor, diseñador o desarrollador de la apliación y
esperar por las mejoras.
Los ambientes Linux ofrecen
algunas alternativas para mantener copias de
un conjunto de archivos en varios equipos.
La forma más común y fácil de administrar
las copias de un conjunto de archivos
involucra la utilización de una red basada en
servicios para la administración de cuentas o
registros de usuario. Cuando se emplea esta
alternativa, cada computador realiza
consultas a un servicio central, el cual
maneja la autorización, la autenticación y la
información de los usuarios dentro del
sistema.
          Para la configuración manual
de clusters, los servicios más utilizados son
NIS (Network Information Service) o LDAP
(Lightweight Directory Access Protocol); sin
embargo; también se habilitan de forma
automática con los toolkits de OSCAR y
NPACI Rocks.
Las        actividades         de
administración y balanceo de carga que
son críticas para un entorno cluster son:
• Administrar la disponibilidad de los
nodos.
• Configurar atributos de los nodos que
sean importantes para balanceo de carga.
• Administrar usuarios y grupos mediante
cuotas de disco.
• Configurar y diseñar políticas.
• Administrar reservaciones y recursos
dedicados.
• Monitorear y generar un historial de
utilización de recursos para usuarios y
grupos.

Weitere ähnliche Inhalte

Ähnlich wie Diapositivas blog

Organizacion de los sistemas operativos
Organizacion de los sistemas operativosOrganizacion de los sistemas operativos
Organizacion de los sistemas operativosJoseGCordero
 
Diferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoDiferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoValdivia0312
 
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011ecuatareas
 
Administracion de datos
Administracion de datosAdministracion de datos
Administracion de datosUsein Gonzalez
 
Presentacion sistemas operativos
Presentacion sistemas operativosPresentacion sistemas operativos
Presentacion sistemas operativosPedro_Pizarro
 
Estructura de los Sistemas Operativos
Estructura de los Sistemas OperativosEstructura de los Sistemas Operativos
Estructura de los Sistemas OperativosMoisés Payares
 
Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Leo San Martin
 
Trabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-FTrabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-Fcrow123456
 
TRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOSTRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOScrisstthi
 
Actividades De Un Administrador De Red
Actividades De Un Administrador De RedActividades De Un Administrador De Red
Actividades De Un Administrador De RedGiova7910
 
Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159triujeque
 
trabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinostrabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinosdarwinjher
 
Sistemas operativos - trabajo darwin
Sistemas operativos -  trabajo darwinSistemas operativos -  trabajo darwin
Sistemas operativos - trabajo darwindarwinjher
 
Panel de control
Panel de controlPanel de control
Panel de controlequipo203
 
Actividad para evaluar el primer parcial
Actividad para evaluar el primer parcialActividad para evaluar el primer parcial
Actividad para evaluar el primer parcialcobaej plantel10
 

Ähnlich wie Diapositivas blog (20)

Nagios
Nagios Nagios
Nagios
 
Organizacion de los sistemas operativos
Organizacion de los sistemas operativosOrganizacion de los sistemas operativos
Organizacion de los sistemas operativos
 
Diferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativoDiferenciar las-funciones-del-sistema-operativo
Diferenciar las-funciones-del-sistema-operativo
 
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011Trabajo grupal sistemas operativos nº 2 capítulo 3  06 11-2011
Trabajo grupal sistemas operativos nº 2 capítulo 3 06 11-2011
 
Administracion de datos
Administracion de datosAdministracion de datos
Administracion de datos
 
Presentacion sistemas operativos
Presentacion sistemas operativosPresentacion sistemas operativos
Presentacion sistemas operativos
 
Estructura de los Sistemas Operativos
Estructura de los Sistemas OperativosEstructura de los Sistemas Operativos
Estructura de los Sistemas Operativos
 
Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02Manualdeword 110407125851-phpapp02
Manualdeword 110407125851-phpapp02
 
Manual de word
Manual de wordManual de word
Manual de word
 
Trabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-FTrabajo integrador ordinario 3-F
Trabajo integrador ordinario 3-F
 
Administrador de red
Administrador de redAdministrador de red
Administrador de red
 
TRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOSTRABAJO SISTEMAS OPERATIVOS
TRABAJO SISTEMAS OPERATIVOS
 
Actividades De Un Administrador De Red
Actividades De Un Administrador De RedActividades De Un Administrador De Red
Actividades De Un Administrador De Red
 
Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159Diferenciar las-funciones-del-sistema-operativo-160105191159
Diferenciar las-funciones-del-sistema-operativo-160105191159
 
trabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinostrabajo de los sistemas operativos - darwin chirinos
trabajo de los sistemas operativos - darwin chirinos
 
Sistemas operativos - trabajo darwin
Sistemas operativos -  trabajo darwinSistemas operativos -  trabajo darwin
Sistemas operativos - trabajo darwin
 
Sistemas operativos 2
Sistemas operativos 2Sistemas operativos 2
Sistemas operativos 2
 
Panel de control
Panel de controlPanel de control
Panel de control
 
2 conceptos basicos
2 conceptos basicos2 conceptos basicos
2 conceptos basicos
 
Actividad para evaluar el primer parcial
Actividad para evaluar el primer parcialActividad para evaluar el primer parcial
Actividad para evaluar el primer parcial
 

Kürzlich hochgeladen

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 

Kürzlich hochgeladen (19)

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 

Diapositivas blog

  • 2.
  • 3. Existen algunas alternativas de herramientas de software que permiten la administración, monitoreo y balanceo de carga computacional en los clusters de computadores personales. Estas tareas específicas pueden ser administradas con herramientas bien conocidas, tales como: C3 (Cluster Command & Control) y Ganglia, que presentan funcionalidades para la administración y monitoreo; Condor y PBS (Portable Batch System), que permiten la planificación, asignación de recursos y tareas.
  • 4. La operación de clusters requiere de un manejo adecuado de los recursos asociados. Los recursos del cluster deben ser administrados adecuadamente para que el administrador invierta la menor cantidad de tiempo en detectar, investigar y recuperar fallos de hardware y software, y de este modo definir posibles medidas de contingencia y tratar que el sistema esté libre de errores. A su vez, estos pasos permiten la adaptabilidad a los requerimientos y cambios constantes que se presentan en la manipulación de tecnologías cluster, en cuanto se refiere al hardware, software y al uso de ciertos patrones de diseño.
  • 5. El administrador de un cluster debe tomar en cuenta algunos aspectos, una vez que se ha completado la instalación de los recursos básicos de hardware y software. Estos aspectos incluyen la configuración e instalación de un sistema de archivos universal, la configuración y administración de recursos mediante herramientas implementadas en software; el monitoreo de sus actividades y el registro de cada uno de los eventos generados por la ejecución de cálculos computacionales.
  • 6. Varios de los sistemas • Definición y administración de más importantes para la nodos. instalación automática de • Administración de colas por lotes clusters, incluyen (Batch Queue Management). herramientas de monitoreo, • Administración de recursos: grupos NIS (Network Information Service), administración y registro de cuotas de disco y CPU. eventos mediante paquetes • Administración de servicios de de distribución para sistemas resolución de nombres : DNS Windows y Linux. Entre estos (Domain Name sistemas están OSCAR y System para clusters).. • Registro de usuarios para clusters de Rocks NPACI; ambos dimensiones superiores a los 100 sistemas permiten el uso de nodos. herramientas de software que • Monitoreo de carga. tienen propósitos específicos tales como:
  • 7.
  • 8. El manejo de logs, o el registro de eventos generados tanto por el kernel del sistema operativo, como por los diferentes servicios que han sido habilitados para el establecimiento de comunicación entre los nodos, se lo puede realizar mediante comandos del sistema operativo Linux para poder visualizar los archivos de logs, o utilizar herramientas de monitoreo tales como: • LogCheck • Swatch • LogSentry • LogDog
  • 9. El monitoreo permite conocer si todos los componentes de hardware y software están disponibles y operando de acuerdo a lo esperado. Es decir, debe asegurarse que todos los componentes de hardware estén disponibles durante el arranque del sistema operativo (CPUs, memoria, discos, dispositivos de red y otros), y de igual forma, que todos los servicios de software, tales como: planificadores de tareas, administradores de recursos, y demonios de monitoreo se ejecuten correctamente en el cluster. Entre las herramientas de monitoreos se pueden mencionar: • Big Brother • Cluemon • Ganglia • Nagios • PARMON • Supermon
  • 10. La administración del cluster implica resolver problemas provocados por fallos de hardware y/o software. Los fallos causados por hardware pueden ocasionar que el cluster quede inutilizable. La recuperación ante fallos a nivel de hardware implica: 1. Aislar los componentes que fallaron para asegurar que no causen un considerable impacto en las actividades del cluster. 2. Manejar los componentes de respaldo (backup), para poder hacer reemplazos y minimizar los efectos del fallo. Los fallos de componentes de software muchas veces no tienen solución o forma de recuperación. Si se considera que el sistema operativo está basado en Linux, la mayor parte de aplicaciones requieren de parches o nuevas versiones para mejorar o recuperarse de errores; sin embargo, este proceso es muy complejo y conlleva mucho tiempo. Por tal motivo, si un componente de software falla lo único que resta por hacer es informar al vendedor, diseñador o desarrollador de la apliación y esperar por las mejoras.
  • 11. Los ambientes Linux ofrecen algunas alternativas para mantener copias de un conjunto de archivos en varios equipos. La forma más común y fácil de administrar las copias de un conjunto de archivos involucra la utilización de una red basada en servicios para la administración de cuentas o registros de usuario. Cuando se emplea esta alternativa, cada computador realiza consultas a un servicio central, el cual maneja la autorización, la autenticación y la información de los usuarios dentro del sistema. Para la configuración manual de clusters, los servicios más utilizados son NIS (Network Information Service) o LDAP (Lightweight Directory Access Protocol); sin embargo; también se habilitan de forma automática con los toolkits de OSCAR y NPACI Rocks.
  • 12. Las actividades de administración y balanceo de carga que son críticas para un entorno cluster son: • Administrar la disponibilidad de los nodos. • Configurar atributos de los nodos que sean importantes para balanceo de carga. • Administrar usuarios y grupos mediante cuotas de disco. • Configurar y diseñar políticas. • Administrar reservaciones y recursos dedicados. • Monitorear y generar un historial de utilización de recursos para usuarios y grupos.