Que Es Un Cluster

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 28

|   

onjunto de maquinas, conectadas entre si en red y


funcionando en paralelo y compartiendo recursos para
cooperar en cargas de trabajo complejas y conseguir mayor
eficacia que un solo equipo. Dado que se comporta como un
único gran recurso

  
 
r   J Pueden ser simples computadores, sistemas multiprocesador o
estaciones de trabajo (workstations), tenemos dos tipos de nodos, que sonJ

odos DedicadosJ no disponen de teclado, mouse ni monitor y su uso está


exclusivamente dedicado a realizar tareas relacionadas con el cluster.

odos no dedicadosJ disponen de teclado, mouse y monitor y su uso no está


exclusivamente dedicado a realizar tareas relacionadas con el cluster, el cluster
hace uso de los ciclos de reloj que el usuario del computador no esta
utilizando para realizar sus tareas.

r G   J El almacenamiento puede consistir en una , una  , o


almacenamiento interno en el servidor. El protocolo más comúnmente
utilizado es  ( etwork ile ystem), sistema de ficheros compartido entre
servidor y los nodos.
r u     J Deben de uso y acceso facilidad, y permitir además múltiples procesos y
usuarios. (conjunto de compiladores y aplicaciones especiales )

r
 J Los nodos conectadas mediante una simple red Ethernet con placas
comunes (adaptadores de red o s), o utilizarse tecnologías especiales de alta velocidad
como ast Ethernet, Gigabit Ethernet, Myrinet, nfiniband, etc.

r -  J Es un software que generalmente actúa entre el sistema operativo y las
aplicaciones y provee a un cluster lo siguienteJ
 na interfaz única de acceso al sistema, denominada  (ingle ystem mage), la cual genera
la sensación al usuario de que utiliza un único ordenador muy potente.
 erramientas para la optimización y mantenimiento del sistemaJ migración de procesos,
checkpointrestart (congelar uno o varios procesos, mudarlos de servidor y continuar su
funcionamiento en el nuevo host), balanceo de carga, tolerancia a fallos, etc.
 EscalabilidadJ debe poder detectar automáticamente nuevos servidores conectados al cluster
para proceder a su utilización.
Ejemplos de middleware J MO , OpenMO , ondor, OpenL, etc.
r a    
     
r G   
r G  a   a   J Que nos permiten implementar algoritmos que hagan
uso de recursos compartidosJ P (entral Processing nit), memoria, datos y servicios.

      
 
·. lto rendimiento (P, high performance)
Los clusters de alto rendimiento han sido creados para compartir el recurso más
valioso de un computador, el à  . ualquier operación que necesite
altos tiempos de P puede ser utilizada en un cluster de alto rendimiento,
siempre que se encuentre un algoritmo que sea paralelizable.

2 lta disponibilidad o de redundancia (, high availability)


Los clusters de alta disponibilidad 
à     pretenden dar servicios de
cualquier tipo, son clusters donde la principal funcionalidad es estar controlando y
actuando para que un servicio o varios se encuentren activos durante el máximo
periodo de tiempo posible (›     
).

3 lta confiabilidad (
, high reliability)
Estos clusters tratan de aportar la  
 
 
   à Puede
tratarse por ejemplo de sistemas de respuesta a tiempo real. 



 



 


Este tipo de clusters son los más difíciles de implementar. o se basan solamente
en conceder servicios de alta disponibilidad, sino en ofrecer un entorno de sistema
altamente confiable. Esto implica muchísima sobrecarga en el sistema.
[  
 

lusters en plicaciones Empresariales


ͻEjemplosJ wikipedia y Google.

lusters en plicaciones ientíficas


EjemplosJ imulaciones, genómica
computacional, predicción
meteorológica, etc..
˜      
- 
 
Donde una de las computadoras del cluster desempeña el
papel de

 . Dicho administrador se encarga de
recolectar información sobre la



 del cluster y
de enviar los procesos a las computadoras con menor carga. El
administrador puede ser  explícitamente por el
operador del Microluster (mediante un archivo de
configuración) o puede ser elegido automáticamente al iniciar
el cluster.
6   
 

MM lexibilidad.
MM Disponibilidad.
MM Escalabilidad.
MM recimiento por incrementos
MM ncorporación de tecnología punta.
MM provecha ciclos perdidos
MM eterogeneidad.

a   
 

MM Existen todavía varios problemas propios de estos sistemasJ


MM oftware.
MM Problemas de administración y gestión.
MM Memoria físicamente distribuida => utilización menos eficiente.
MM arias copias del sistema operativo.
MM La red es el cuello de botella del sistema.
§         
Ú Procesar un
 à

 

  significa que dicha
aplicación se ejecuta en forma distribuida sobre un cierto número de
nodos del cluster. sí, 

 à




à 
 à y
esto permite que diferentes  
 
›

en lugar
de hacerlo secuencialmente sobre un solo procesador. Los procesos
͞distribuidos͟ o ͞paralelizados͟ de un algoritmo, en general, no son
independientes entre sí; es decir que 

 à
 à   
     à   
  à   que
corren sobre otros nodos. Esta información debe ser transmitida a través
de la red que los conecta.
Ú Para 
›


›
 
 ›   , se han
desarrollado herramientas especiales. na de ellas es la  

 

 (-a , del ingles Message Passing nterface) y la otra es
conocida como 



››
 
› (P M, del ingles Parallel irtual
Machine).
§L EO DE 
G

n tipo concreto de cluster cuya función es repartir la carga de proceso entre los
nodos y            disponibles en este, es el   à
  , sistema automático que  à      à à

    

 

 › 

 . los algoritmos de MO
comparten los recursos disponibles en forma adaptativa mediante un à

 
    . nternamente y de forma transparente para el usuario, los
procesos serán migrados
›       › 
. Dado que
las demandas en cada nodo pueden variar en el tiempo,     


àà 
 à  
à



  à

  De
forma alternativa, si fuera necesario,   
  


 à͟ sus
  › 

  
  
 ›

Las características más destacadas de este tipo de cluster sonJ
u 
 ›



 ›

  
 
› › .

obustez. nte la
!

› ›  
 › › ›   
   
 "  
#
$
 
   
 "% 
 
    
El aspecto del 



 
à
à à
à
debido a que en muchas
›
 

››
"  ›

&
 ›
 
" es extraordinariamente ! ›
  ›

›


 asignadas a cada procesador,
de manera que se realice una  ›




  

›


  
 
› . '
 
  , es decir, hay desbalance en la carga ya sea
que el trabajo no se haya repartido de una forma equitativa o
porque algunos procesadores sean más rápidos que otros, o
por ambas situaciones, entonces
›  
 
 
  
  
 
   
!


› ›
 
La situación ideal es que todos  
 à

 


 à 
 


    


    à   


*  §   

§   
  
Ú El balanceo de carga también es llamado mapeado del problema 
›

› ›
. La   ›


 
›

›
 ›
  
"›  
›  
›
 
 

›
  

 #
$


 

›


 


 ›
 La asignación de tareas se puede realizar de
una sola vez o de manera cíclica
Ú El balanceo de carga estático tiene serios    que lo
sitúan en desventaja sobre el balanceo de carga dinámico. Entre
ellos cabe destacar los siguientesJ
 Es muy ! ›
 
  
›    
 
›

›
  

 
›
.
  veces los problemas necesitan &  
 
 
 
 
›


›


 › 
å§   
 ˜  

Ú Este tipo de balanceo de carga se trata 


à
    .

carga computacional  ›


 
 $
 ›

›  

 
. unque el
balanceo de carga dinámico ››
  
  
  


›

  › 

" ›
una alternativa mucho  
›
›
  

 
balanceo de carga dinámico es muy &› 
 ›& 



$ ›&  
   ›  
 ›& 


  
›  ›

›
. na importante
característica del balanceo de carga dinámico es la capacidad que tiene la

 
  


 
     
    à
, no sólo a la
carga de los procesadores sino también a posibles reconfiguraciones de
los recursos del sistema. Debido a esta característica, un cluster puede
responder bastante bien cuando se produce el fallo de algún procesador,
lo cual simplifica la creación de aplicaciones tolerantes a fallos que sean
capaces de sobrevivir cuando se pierde algún esclavo o incluso el maestro.
. Dependiendo de dónde y cómo se almacenen y
repartan las tareas el balanceo de carga
dinámico se divide enJ
 §alanceo de carga dinámico centralizado. e
corresponde con la estructura típica de

 () ›
.
 §alanceo de carga dinámico distribuido o
descentralizado. e utilizan
 
 $


   ›

   ›
.
å§           
Ú uando    ›

›



" › 



›
 
Ú Esta técnica también se denomina 

 

  ›


 ,
y no sólo es aplicable a problemas que tengan tareas de un mismo tamaño.
Ú En problemas con tareas de distintos tamaños es mejor 
   
››




$ 

  
 
›. i la tarea más compleja se dejase
para el final, las tareas más pequeñas serían realizadas por esclavos que después
estarían esperando sin hacer nada hasta que alguno completara la tarea más
compleja.
Ú En algunas aplicaciones, especialmente en algoritmos de búsqueda, ›
  



 



, aunque al final el número de tareas se
debe de reducir a cero para alcanzar la finalización del programa. En este contexto
se puede utilizar 
 ›



 ›


 . i todas las tareas
son del mismo tamaño y de la misma importancia o prioridad, una cola O (irst
n irst Out) puede ser más que suficiente.
åå§             
   
Ú na gran desventaja del balanceo de carga dinámico
centralizado es que el 
 à 
 à

à 




 ! " 


 



 
     

 
à    
 
. Por tanto, se
pueden producir colisiones si varios esclavos solicitan
peticiones de tareas de manera simultánea.
Ú La estructura centralizada únicamente será
 
› #
$ #  ›
$›



 
  
 
›. Para tareas de
grano fino (tareas con muy poca carga computacional)
y muchos esclavos es apropiado distribuir las tareas en
más de un sitio.
-*˜aGG-G ˜
§GG
˜
G!G
Ú un método para balancear la carga de trabajo tratando de optimizar al máximo el tiempo
total de ejecución. onsiderando esto el tipo de cluster seleccionado es el de  
  (P, high performance), ya que cuando la palabra cluster es pronunciada, la
primera cosa que pasa por la cabeza es alto desempeño, este tipo de cluster es el más común
entre las comunidades científicas, sistemas predictivos,simulaciones ,que exigen alto poder
de procesamiento.
"  
Ú dado un problema complejo e identificado como paralelizable, un servidor (maestro) debe
ser responsable de dividir este problema en numerosas partes para ser procesadas en nodos
esclavos (nodos dedicados al procesamiento). sí, una vez que cada nodo esclavo encuentre
una solución, este la envía al nodo maestro para que el maestro presente la solución
completa del problema.



 

   
 
    
 


 
  


 
-*˜aGG-G ˜
§GG
˜
G!G
Ú e trabajará con el             , el cual consiste en que la
asignación de la carga es efectuada por el nodo maestro a todos sus esclavos.
Ú El nodo maestro será el encargado de recibir todas las tareas que se deberán ejecutar y
tomar la mejor decisión al momento de realizar la repartición de éstas teniendo siempre en
cuenta cuál nodo es más o menos fuerte dentro del clúster.
 




 


 


 
  


 

Ú En el método se verá que el nodo maestro no realizará ninguna de las tareas, sólo
las distribuirá. De ahí, se descarta todo lo que concierne con el balanceo de carga
estático, donde el nodo maestro participa activamente de la ejecución de las
tareas en la computación una vez que haya asignado el trabajo a los nodos
esclavos realizando este proceso una vez o cíclicamente.
†˜  - 
Ú En este trabajo el método que se propone consiste en la distribución de tareas en los nodos esclavos por parte del nodo
maestro, el cual recopilará una a una las tareas conforme van llegando a medida que pasa el tiempo.
Ú La asignación de las tareas a los nodos esclavos dependerá del tamaño de las tareas y de una función de aptitud, la cual es
calculada por el nodo maestro después de que el nodo esclavo envía ciertos atributos (velocidad de procesamiento,
capacidad de memoria y tiempo de respuesta).


   
    
   

Ú Después de que el nodo maestro asigna una tarea a cierto nodo esclavo, el esclavo ejecutará
la tarea y enviará al nodo maestro una notificación de terminación de tarea, indicándole así al
nodo maestro que esta listo para ejecutar una nueva.
Ú                        
                .
Ú El cálculo de la función de aptitud corresponde a la sumatoria entre los atributos
mencionados previamente, donde cada uno de estos estará multiplicado por un peso que
dependerá de la importancia de este factor en el cluster.

uncionptitud(i)=cp(i) *a+cm(i) *b +tr(i) *c dondeJ


cp(i) = velocidad de procesamiento del nodo i
cm(i) = capacidad de memoria del nodo i
tr(i) = tiempo de respuesta o latencia del nodo i
a, b, c = pesos asociados a cada variable y que dependen del tipo de clúster seleccionado
Ú Para hacer el cálculo de la función de aptitud en los nodos es necesario normalizar cada   
  
Ú En este método se tendrán en cuenta los tamaños de las tareas para la asignación, recopilando
estos por medio de series de tandas que se crearan acorde a la cantidad de nodos esclavos.

   
   

Ú ·. u    # J en un vector se almacenan todas las tareas iníciales organizadas
de mayor a menor tamaño cada una de estas presenta un D que identifica que tarea es; el otro
vector recopila los nodos esclavos organizados por función de aptitud de mayor a menor.
Ú 2. u            $    %u**    
        %u"G 


 

 



  
  

˜

   !   

"#



 !! ! 

$

   ! 
 
 #
%



Ú '. En este punto, el maestro ya conoce cual es la capacidad de cada
nodo esclavo y procede con la        teniendo
en cuenta los cálculos realizados y que las tareas se encuentran
organizadas de mayor a menor tamaño y los nodos se encuentran
también organizados de mayor a menor pero en cuanto a función
de aptitud.
Ú Para iniciar con la asignación se deberá    
         

Ú Para cada nodo          *  % que
contendrá las tareas que le serán asignadas para ejecutar.

        


Ú                     
  que será un contador (sumatoria de tamaños de tareas) que examinará si
la tarea a ser asignada podrá o no estar en la tanda de tareas del nodo respectivo
cumpliendo o no con los requisitos del rango de cada nodo esclavo. Esta variable
se conocerá como umatoriaTanda(i).

Ú  continuación se realiza la asignación de las tareas a los nodos teniendo en


cuenta la variable umatoriaTanda(i) almacenada en el nodo maestro para cada
nodo esclavo.
Ú e toma el primer tamaño de tarea que se encuentra en el vector de tareas y se
acumula en umatoriaTanda(i).
Ú b) e examina sí umatoriaTanda(i) es menor que Limitenferior odo(i). De ser cierto, se
asigna esa tarea a la Tanda(i), se elimina esta tarea del vector y se evalúa sí hay aun tareas en
el vector de tareas, si es así se continua con la siguiente tarea del vector hasta que
umatoriaTanda(i) sea menor que Limiteuperior odo(i), esto implica que la tanda se
encuentra lista para ser asignada al nodo y se encuentra dentro del rango admisible por ese
nodo.
Ú e examina si hay más tareas por asignar en el vector de tareas y se continúa con el siguiente
nodo realizando el mismo procedimiento.
Ú in embargo puede haber casos excepcionales en el que ya se hayan asignado algunas tareas
a la tanda y la tarea siguiente a ser asignada sobrepase el Limiteuperior odo(i), en este caso
esta tarea no se asigna a dicho nodo y se evalúa para el nodo siguiente, de ahí se puede
observar que este nodo aún posee espacio disponible para ejecutar alguna tarea. También
puede existir la posibilidad de que la primera tarea del vector de tareas exceda
inmediatamente el Limiteuperior odo(i),
Ú cuando esto ocurre, se le asigna dicha tarea a este nodo, y se cambia de nodo y tarea.

Ú c) Después de haber asignado las tareas a los nodos esclavos en sus respectivas tandas se
debe analizar nuevamente sí aún quedan tareas en el vector de tareas, de ser el caso, estas
deberán ser incluidas en una nueva tanda que será destinada a las tareas faltantes y que
deberán ser asignadas a las tandas de los nodos esclavos que tengan aún espacio sin exceder
en el Limiteuperior odo(i).

Ú d) í llegasen a faltar tareas por ser asignadas después de realizar el paso anterior y ninguna
entra en el rango de los nodos esclavos entrará una nueva variable a tomar parte de la
asignación. Esta será el tiempo de ejecución, que será el tiempo que tarda cada nodo en
ejecutar una tarea respectiva. Esta variable es calculada como el espacio (tamaño de la tarea
que se esta realizando) sobre la velocidad (función de aptitud del nodo ejecutor de la tarea).
Ú El procedimiento a seguir es calcular el tiempo de ejecución total
acumulado en cada nodo esclavo (TiempoEjecucionTotal(i)),
tomando la tanda de tareas de cada nodo (Tanda(i)) y calculando el
tiempo de ejecución para cada una de las tareas que tiene dicho
nodo.
Ú Posteriormente se procede a tomar la primera tarea que se
encuentra en la tanda de tareas faltantes y a calcular un tiempo de
ejecución supuesto TiempoEjecucionupuesto(i)), para cada nodo
con dicha tarea y a acumularlo en el TiempoEjecucionTotal(i) de
cada nodo. Luego se procederá con la revisión de cual nodo posee
el menor tiempo de ejecución total supuesto
TiempoEjecucionTotalupuesto(i)), aquel que tenga dicho tiempo
será el nodo al cual se le asignará en su tanda esta tarea.
Ú Esto se hace hasta que no queden tareas en la tanda de
tareas faltantes.

Ú e) inalmente el nodo maestro envía a sus nodos


esclavos una por una las tareas respectivas de las
tandas que les corresponden para que comiencen a
ejecutarlas. ada vez que un esclavo finalice una tarea
propia este envía una notificación de terminación de
tarea con el fin de que el maestro envíe la siguiente
tarea de su tanda, haciendo esto hasta que culmine de
ejecutar todas sus tareas.

También podría gustarte