Duvida no takeover utilizando Heartbeat
Oi pessoal,
Tenho um cluster com tres servidores ligados na mesma rede.
O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.
Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.
O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.
Se alguém conseguir me explicar porque isto está acontecendo agradeço
:?
Cumprimentos :)
Nelia
Re: Duvida no takeover utilizando Heartbeat
Citação:
Postado originalmente por Filipa_Nelia
Oi pessoal,
Tenho um cluster com tres servidores ligados na mesma rede.
O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.
Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.
O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.
Se alguém conseguir me explicar porque isto está acontecendo agradeço
:?
Cumprimentos :)
Nelia
O heartbeat por enquando não possui recurso de cluster N+1, via algoritmo ring, somente trabalha em pares de máquinas.
Somente existe solućão para isso de forma comercial, se não me engano de steel eyes.
[]s
Marcos Pitanga
Linux Clusters Specialist
Duvida no takeover utilizando Heartbeat
Peço desculpa, não expliquei bem.
Na verdade são dois clusters: um com servidor HTTP e outro com servidor SQUID. Existe uma terceira máquina que corre estes dois serviços e pertence aos dois clusters.
Servidor HTTP:
/etc/ha.d/ha.cf:
node servidor1
node servidor3
mcast eth0 225.0.0.1 694 1 0
/etc/ha.d/haresources:
servidor1 192.168.85.4 httpd
Servidor SQUID:
/etc/ha.d/ha.cf:
node servidor2
node servidor3
mcast eth0 226.0.0.1 694 1 0
/etc/ha.d/haresources:
servidor2 192.168.85.5 squid
Servidor HTTP+SQUID:
/etc/ha.d/ha.cf:
node servidor1
node servidor2
node servidor3
mcast eth0 225.0.0.1 694 1 0
mcast eth0 226.0.0.1 694 1 0
/etc/ha.d/haresources:
servidor1 192.168.85.4 httpd
servidor2 192.168.85.5 squid
Quando faço "service heartbeat stop" no servido HTTP e no servidor SQUID o servidor HTTP+SQUID faz o takeover dos dois serviços.
Mas se encerrar essas duas máquinas fisicamente (sem terminar o heartbeat), a terceira máquina so faz o takeover do serviço que parar primeiro. Essa máquina detecta que as outras duas falharam e que desistiram dos recursos mas so faz o takeover da primeira que detecta.
Não percebo porque funciona bem com a paragem do heartbeat manualmente e com o encerramento das máquinas já não.
Obrigada
Nélia
Duvida no takeover utilizando Heartbeat
Experimente mandar um email para o Allan Robertson criador do heartbeat
[email protected]
Ele é muito gente fina e responderá para vc.
Mas, antes dá uma olhada no FAQ do www.linux-ha.org
[]'s
Marcos Pitanga
System Engineer
Gplus Energy - High Performance Computing
www.gplus.com.br