SlideShare ist ein Scribd-Unternehmen logo
1 von 6
Downloaden Sie, um offline zu lesen
Sistemas distribuidos: Clúster
En este apartado voy a explicar lo que es y consiste básicamente un sistema
distribuido (clúster).
Definición:
Un clúster es un conjunto de ordenadores que están conectados entre sí por
medio de una red, para compartir recursos con el objetivo de realizar tareas y
funciones como si fuesen un único ordenador (memoria distribuida).
Sirve para cuando queramos realizar tareas que necesiten grandes requerimientos
de memoria y CPU y para ahorrarnos horas de trabajo en tareas y operaciones.
Tipos de Cluster:
Hay 3 tipos de cluster:
 High Performance o Alto rendimiento.
 High Availability o Alta Disponibilidad.
 High Reliability o Alta Confiabilidad.
Alto Rendimiento
El objetivo es mejorar el rendimiento, de tiempo o precisión, para la solución de un
problema.
Este tipo suele estar ligado a solucionar los siguientes problemas:
 Cálculos matemáticos
 Mejora de gráficos
 Compilación de programas
 Descifrado de códigos
 Rendimiento del sistema operativo
Alta disponibilidad
Los clústeres de alta disponibilidad están destinados a mejorar los servicios que
ofrecen las empresas de cara a los clientes de una red, ya sea local o de internet.
Fundamentalmente tienen dos características:
 Fiabilidad
 Disponibilidad
Alta confiabilidad
Con alta confiabilidad se trata de aportar la máxima confianza es un entorno en el
cual se necesita saber que el sistema siempre se va a comportar de una forma
determinada, como por ejemplo sistemas de respuesta a tiempo real.
Suele ser usado para entornos de tipo empresarial, necesitando un hardware
especializado.
Clúster Google:
Google necesitaría muchísima potencia para abastecer los servicios de todos los
usuarios del mundo, una media de 40 millones de búsquedas diarias. Para
conseguir esta potencia Google desarrolló varios servidores, cada uno de ellos
formado por un clúster. Consiguiendo así la potencia necesaria para todas las
peticiones. Cada clúster de Google se compone de 359 racks (estructura parecida
a una estantería para organizar los nodos), 31654 nodos, 63184 CPUs, 126.368
GHz de potencia de procesamiento, 63.184 Gbytes de RAM y 2.527 Tbytes de
espacio en disco duro.
Un ejemplo claro de un clúster es la siguiente imagen:
Elementos necesarios:
Dos o más nodos (ordenadores) compuestos al menos por un microprocesador,
una memoria y una interfaz para que se puedan comunicar con la red del clúster.
Hardware apropiado al tipo de clúster que vamos a utilizar.
Tarjeta de red.
 Un medio de transmisión entre ellos como por ejemplo RJ-45.
 Software de sistema y un software de aplicación.
Software de sistema
Podemos usar distintos sistemas operatios para conseguir el funcionamiento del
cluster, como son:
 Ubuntu server
 Windows Server
 OpenMosix
 ParallelKnoppix
 Pelican
Software de Aplicación
Dependiendo del sistema operativo que vayamos a utilizar necesitaremos unos
paquetes o programas:
En el caso de Linux:
 HeartBeat: ejecuta los servicios en los nodos.
 HeartBeat-Stonith: es una técnica HeartBeat que se encarga de controlar
que cuando un servidor esté caído no interfiera en el funcionamiento del
cluster.
En el caso del Windows:
A partir de Windows 2003 server los servidores ya viene preparado con el software
necesario. Para mejorar el rendimiento en Windows server 2008 podemos usar
Failover clúster.
El siguiente paso será la instalación del cluster.
Montar un clúster con Linux:
http://root-neztgul.blogspot.com/2008/08/como-montar-un-cluster-con-
linux.html
CONCEPTO DE LOS ALGORITMOS DE CLUSTERING
El Clustering es una técnica estadística que permite una generación automática de
grupos en los datos. Incluso, existen algoritmos de Clustering que permiten la
generación de grupos jerárquicos, consiguiendo una mayor abstracción y
representación de la información para poder recuperarla más eficiente.
En cuanto a los factores que influyen en el Clustering son:
 Propiedades o atributos a gestionar de los objetos que representan el
conjunto de datos.
 Función matemática que mide la distancia entre dos objetos. Las funciones
típicas son la distancia Manhattan, la distancia Euclídea, el producto
escalar y demás.
 Las restricciones a las que está sujeto el conjunto de datos a clasificar,
principalmente una a destacar: la elección del número de clústeres: existen
muchos criterios y todos ellos basados en heurísticas basadas en el cálculo
de distancias entre los objetos.
Uso del Clustering en la extracción de información
En la extracción de la información la técnicas basadas en Clustering son muy
comunes para aquellos casos donde no existan conjuntos de entrenamiento, la
información cambia dinámicamente o se pretende extraer propiedades o clases de
información.
En el dominio de la extracción de la información se distinguen dos aplicaciones
muy útiles:
Extracción de correferencias en los nombres de una frase. Se trata de relacionar
nombre y pronombres que se refieren a la misma persona, cosa, lugar, fecha...
Por ejemplo, en la frase "Bill Clinton fue a Nigeria para hablar con los trabajadores
del SIDA. Después, el presidente de USA y su mujer fueron de viaje a China..." se
tiene una primera clase que es Bill Clinton y una serie de nombres y pronombres
que le referencian: "el presidente de USA" y "su". Sacar relaciones de texto es un
problema NP-duro, pero mediante técnicas de Clustering y mediante la adición de
restricciones, se puede resolver con bastante menor costo computacional, tanto en
tiempo como en memoria.
Correferencias de frases en diferentes documentos. Recuperar cadenas de
caracteres en distintos ficheros y que hagan referencia al mismo contexto. Esto es
de gran utilidad para los buscadores y recuperadores de información que
actualmente incluye el Windows Vista y anteriormente Mac OS , la recuperación
de información no sólo consiste en el nombre del archivo, sino que también
comprueba la información y el contexto de dentro de cada archivo o fichero.
Fuentes:
http://extraccionrecuperacionnosupervisada.50webs.com/clustering.html por Javier
Moya Amador
http://root-neztgul.blogspot.mx/2008/11/sistemas-distribuidos-cluster.html
recuperado el 18 de noviembre de 2008

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (13)

NO SQL y Cassandra
NO SQL y CassandraNO SQL y Cassandra
NO SQL y Cassandra
 
Informe cassandra
Informe cassandraInforme cassandra
Informe cassandra
 
Recuperación de-datos-en-my sql
Recuperación de-datos-en-my sqlRecuperación de-datos-en-my sql
Recuperación de-datos-en-my sql
 
Actividad2uni3
Actividad2uni3Actividad2uni3
Actividad2uni3
 
Recuperacion de bd
Recuperacion de bdRecuperacion de bd
Recuperacion de bd
 
Exposicion equipo 1
Exposicion equipo 1Exposicion equipo 1
Exposicion equipo 1
 
Base de datos
Base de datosBase de datos
Base de datos
 
Diferencias entre base de datos relacional y no relacional
Diferencias entre base de datos relacional y no relacionalDiferencias entre base de datos relacional y no relacional
Diferencias entre base de datos relacional y no relacional
 
3.1.6 espacio para objetos
3.1.6 espacio  para objetos3.1.6 espacio  para objetos
3.1.6 espacio para objetos
 
MongoDB: la BBDD NoSQL más popular del mercado
MongoDB: la BBDD NoSQL más popular del mercadoMongoDB: la BBDD NoSQL más popular del mercado
MongoDB: la BBDD NoSQL más popular del mercado
 
Seg. de Información - Perspectivas Generales
Seg. de Información - Perspectivas GeneralesSeg. de Información - Perspectivas Generales
Seg. de Información - Perspectivas Generales
 
3.1.5 espacios privados
3.1.5 espacios privados3.1.5 espacios privados
3.1.5 espacios privados
 
Big table por Matias tesoriero
Big table por Matias tesorieroBig table por Matias tesoriero
Big table por Matias tesoriero
 

Andere mochten auch

Datasheet carrus pistola
Datasheet carrus pistolaDatasheet carrus pistola
Datasheet carrus pistolaThiago Neves
 
Luiz Gonzaga Martins Coelho
Luiz Gonzaga Martins CoelhoLuiz Gonzaga Martins Coelho
Luiz Gonzaga Martins Coelhojuarezxyz
 
Poblacion española
Poblacion españolaPoblacion española
Poblacion española4221777
 
Metodologia ativação projetos pergunta pivo
Metodologia ativação projetos pergunta pivoMetodologia ativação projetos pergunta pivo
Metodologia ativação projetos pergunta pivoDobra Inova
 
Direitoedemocraciajulio
DireitoedemocraciajulioDireitoedemocraciajulio
DireitoedemocraciajulioJulio Rocha
 
manualeconomiapolitica
manualeconomiapoliticamanualeconomiapolitica
manualeconomiapoliticaunirio2011
 
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomaco
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a NicomacoAristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomaco
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomacounirio2011
 
Explicando a crise com burros
Explicando a crise com burrosExplicando a crise com burros
Explicando a crise com burrosBugs naEDucação
 
Gestantes yogaway
Gestantes yogawayGestantes yogaway
Gestantes yogawayYOGAWAY.COM
 
Sistema Nervioso Central
Sistema Nervioso CentralSistema Nervioso Central
Sistema Nervioso CentralErik Sandre
 

Andere mochten auch (20)

Datasheet carrus pistola
Datasheet carrus pistolaDatasheet carrus pistola
Datasheet carrus pistola
 
Tecido ósseo
Tecido ósseoTecido ósseo
Tecido ósseo
 
Arte (Itália)
Arte (Itália)Arte (Itália)
Arte (Itália)
 
Luiz Gonzaga Martins Coelho
Luiz Gonzaga Martins CoelhoLuiz Gonzaga Martins Coelho
Luiz Gonzaga Martins Coelho
 
Poblacion española
Poblacion españolaPoblacion española
Poblacion española
 
Albaida
AlbaidaAlbaida
Albaida
 
Metodologia ativação projetos pergunta pivo
Metodologia ativação projetos pergunta pivoMetodologia ativação projetos pergunta pivo
Metodologia ativação projetos pergunta pivo
 
Direitoedemocraciajulio
DireitoedemocraciajulioDireitoedemocraciajulio
Direitoedemocraciajulio
 
Chistes del futuro
Chistes del futuroChistes del futuro
Chistes del futuro
 
manualeconomiapolitica
manualeconomiapoliticamanualeconomiapolitica
manualeconomiapolitica
 
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomaco
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a NicomacoAristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomaco
Aristóteles - (Coleção Os Pensadores) (vol.2) - inclui Ética a Nicomaco
 
Explicando a crise com burros
Explicando a crise com burrosExplicando a crise com burros
Explicando a crise com burros
 
Usma fundamentos tema 1 definiciones
Usma fundamentos tema 1 definicionesUsma fundamentos tema 1 definiciones
Usma fundamentos tema 1 definiciones
 
Saúde da água
Saúde da águaSaúde da água
Saúde da água
 
Wireframe SiGTA
Wireframe SiGTAWireframe SiGTA
Wireframe SiGTA
 
aguarde, carregando...
aguarde, carregando...aguarde, carregando...
aguarde, carregando...
 
Gestantes yogaway
Gestantes yogawayGestantes yogaway
Gestantes yogaway
 
Sistema Nervioso Central
Sistema Nervioso CentralSistema Nervioso Central
Sistema Nervioso Central
 
Conj 3parte
Conj 3parteConj 3parte
Conj 3parte
 
Farmacoté..
Farmacoté..Farmacoté..
Farmacoté..
 

Ähnlich wie 124076127 sistemas-distribuidos-pdf (20)

Arquitectura del computador clusters
Arquitectura del computador   clustersArquitectura del computador   clusters
Arquitectura del computador clusters
 
Trabajo Clusters
Trabajo ClustersTrabajo Clusters
Trabajo Clusters
 
Cluster de alta disponibilidad con corosync, pacemaker & apache2
Cluster de alta disponibilidad con corosync, pacemaker & apache2Cluster de alta disponibilidad con corosync, pacemaker & apache2
Cluster de alta disponibilidad con corosync, pacemaker & apache2
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
Clúster
ClústerClúster
Clúster
 
Google Cluster
Google ClusterGoogle Cluster
Google Cluster
 
Clusters[1]
Clusters[1]Clusters[1]
Clusters[1]
 
Reporte cluster
Reporte clusterReporte cluster
Reporte cluster
 
Clúster
ClústerClúster
Clúster
 
Cluster
ClusterCluster
Cluster
 
Computación Grid
Computación GridComputación Grid
Computación Grid
 
Clusters
ClustersClusters
Clusters
 
Cluster
ClusterCluster
Cluster
 
Escalabilidad
EscalabilidadEscalabilidad
Escalabilidad
 
Alexander plama tallerlinux
Alexander plama tallerlinuxAlexander plama tallerlinux
Alexander plama tallerlinux
 
Academy Journal Morelia 2018
Academy Journal Morelia 2018Academy Journal Morelia 2018
Academy Journal Morelia 2018
 
Sistema operativo de red
Sistema operativo de redSistema operativo de red
Sistema operativo de red
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
 
HARDWARE,SOFTWARE Y BASES DE DATOS
HARDWARE,SOFTWARE Y BASES DE DATOS HARDWARE,SOFTWARE Y BASES DE DATOS
HARDWARE,SOFTWARE Y BASES DE DATOS
 
S.O
S.OS.O
S.O
 

124076127 sistemas-distribuidos-pdf

  • 1. Sistemas distribuidos: Clúster En este apartado voy a explicar lo que es y consiste básicamente un sistema distribuido (clúster). Definición: Un clúster es un conjunto de ordenadores que están conectados entre sí por medio de una red, para compartir recursos con el objetivo de realizar tareas y funciones como si fuesen un único ordenador (memoria distribuida). Sirve para cuando queramos realizar tareas que necesiten grandes requerimientos de memoria y CPU y para ahorrarnos horas de trabajo en tareas y operaciones. Tipos de Cluster: Hay 3 tipos de cluster:  High Performance o Alto rendimiento.  High Availability o Alta Disponibilidad.  High Reliability o Alta Confiabilidad.
  • 2. Alto Rendimiento El objetivo es mejorar el rendimiento, de tiempo o precisión, para la solución de un problema. Este tipo suele estar ligado a solucionar los siguientes problemas:  Cálculos matemáticos  Mejora de gráficos  Compilación de programas  Descifrado de códigos  Rendimiento del sistema operativo Alta disponibilidad Los clústeres de alta disponibilidad están destinados a mejorar los servicios que ofrecen las empresas de cara a los clientes de una red, ya sea local o de internet. Fundamentalmente tienen dos características:  Fiabilidad  Disponibilidad Alta confiabilidad Con alta confiabilidad se trata de aportar la máxima confianza es un entorno en el cual se necesita saber que el sistema siempre se va a comportar de una forma determinada, como por ejemplo sistemas de respuesta a tiempo real. Suele ser usado para entornos de tipo empresarial, necesitando un hardware especializado. Clúster Google: Google necesitaría muchísima potencia para abastecer los servicios de todos los usuarios del mundo, una media de 40 millones de búsquedas diarias. Para conseguir esta potencia Google desarrolló varios servidores, cada uno de ellos formado por un clúster. Consiguiendo así la potencia necesaria para todas las peticiones. Cada clúster de Google se compone de 359 racks (estructura parecida a una estantería para organizar los nodos), 31654 nodos, 63184 CPUs, 126.368 GHz de potencia de procesamiento, 63.184 Gbytes de RAM y 2.527 Tbytes de espacio en disco duro.
  • 3. Un ejemplo claro de un clúster es la siguiente imagen: Elementos necesarios: Dos o más nodos (ordenadores) compuestos al menos por un microprocesador, una memoria y una interfaz para que se puedan comunicar con la red del clúster. Hardware apropiado al tipo de clúster que vamos a utilizar. Tarjeta de red.  Un medio de transmisión entre ellos como por ejemplo RJ-45.  Software de sistema y un software de aplicación. Software de sistema Podemos usar distintos sistemas operatios para conseguir el funcionamiento del cluster, como son:  Ubuntu server  Windows Server  OpenMosix  ParallelKnoppix  Pelican
  • 4. Software de Aplicación Dependiendo del sistema operativo que vayamos a utilizar necesitaremos unos paquetes o programas: En el caso de Linux:  HeartBeat: ejecuta los servicios en los nodos.  HeartBeat-Stonith: es una técnica HeartBeat que se encarga de controlar que cuando un servidor esté caído no interfiera en el funcionamiento del cluster. En el caso del Windows: A partir de Windows 2003 server los servidores ya viene preparado con el software necesario. Para mejorar el rendimiento en Windows server 2008 podemos usar Failover clúster. El siguiente paso será la instalación del cluster. Montar un clúster con Linux: http://root-neztgul.blogspot.com/2008/08/como-montar-un-cluster-con- linux.html
  • 5. CONCEPTO DE LOS ALGORITMOS DE CLUSTERING El Clustering es una técnica estadística que permite una generación automática de grupos en los datos. Incluso, existen algoritmos de Clustering que permiten la generación de grupos jerárquicos, consiguiendo una mayor abstracción y representación de la información para poder recuperarla más eficiente. En cuanto a los factores que influyen en el Clustering son:  Propiedades o atributos a gestionar de los objetos que representan el conjunto de datos.  Función matemática que mide la distancia entre dos objetos. Las funciones típicas son la distancia Manhattan, la distancia Euclídea, el producto escalar y demás.  Las restricciones a las que está sujeto el conjunto de datos a clasificar, principalmente una a destacar: la elección del número de clústeres: existen muchos criterios y todos ellos basados en heurísticas basadas en el cálculo de distancias entre los objetos. Uso del Clustering en la extracción de información En la extracción de la información la técnicas basadas en Clustering son muy comunes para aquellos casos donde no existan conjuntos de entrenamiento, la información cambia dinámicamente o se pretende extraer propiedades o clases de información. En el dominio de la extracción de la información se distinguen dos aplicaciones muy útiles: Extracción de correferencias en los nombres de una frase. Se trata de relacionar nombre y pronombres que se refieren a la misma persona, cosa, lugar, fecha... Por ejemplo, en la frase "Bill Clinton fue a Nigeria para hablar con los trabajadores del SIDA. Después, el presidente de USA y su mujer fueron de viaje a China..." se tiene una primera clase que es Bill Clinton y una serie de nombres y pronombres que le referencian: "el presidente de USA" y "su". Sacar relaciones de texto es un problema NP-duro, pero mediante técnicas de Clustering y mediante la adición de restricciones, se puede resolver con bastante menor costo computacional, tanto en tiempo como en memoria.
  • 6. Correferencias de frases en diferentes documentos. Recuperar cadenas de caracteres en distintos ficheros y que hagan referencia al mismo contexto. Esto es de gran utilidad para los buscadores y recuperadores de información que actualmente incluye el Windows Vista y anteriormente Mac OS , la recuperación de información no sólo consiste en el nombre del archivo, sino que también comprueba la información y el contexto de dentro de cada archivo o fichero. Fuentes: http://extraccionrecuperacionnosupervisada.50webs.com/clustering.html por Javier Moya Amador http://root-neztgul.blogspot.mx/2008/11/sistemas-distribuidos-cluster.html recuperado el 18 de noviembre de 2008