+ Responder ao Tópico



  1. #1
    Filipa_Nelia
    Oi pessoal,

    Tenho um cluster com tres servidores ligados na mesma rede.
    O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.

    Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
    Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.

    O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.

    Se alguém conseguir me explicar porque isto está acontecendo agradeço
    :?

    Cumprimentos
    Nelia

  2. Citação Postado originalmente por Filipa_Nelia
    Oi pessoal,

    Tenho um cluster com tres servidores ligados na mesma rede.
    O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.

    Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
    Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.

    O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.

    Se alguém conseguir me explicar porque isto está acontecendo agradeço
    :?

    Cumprimentos
    Nelia

    O heartbeat por enquando não possui recurso de cluster N+1, via algoritmo ring, somente trabalha em pares de máquinas.

    Somente existe solućão para isso de forma comercial, se não me engano de steel eyes.

    []s

    Marcos Pitanga
    Linux Clusters Specialist



  3. #3
    Filipa_Nelia
    Peço desculpa, não expliquei bem.
    Na verdade são dois clusters: um com servidor HTTP e outro com servidor SQUID. Existe uma terceira máquina que corre estes dois serviços e pertence aos dois clusters.

    Servidor HTTP:

    /etc/ha.d/ha.cf:
    node servidor1
    node servidor3
    mcast eth0 225.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor1 192.168.85.4 httpd


    Servidor SQUID:

    /etc/ha.d/ha.cf:
    node servidor2
    node servidor3
    mcast eth0 226.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor2 192.168.85.5 squid


    Servidor HTTP+SQUID:

    /etc/ha.d/ha.cf:
    node servidor1
    node servidor2
    node servidor3
    mcast eth0 225.0.0.1 694 1 0
    mcast eth0 226.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor1 192.168.85.4 httpd
    servidor2 192.168.85.5 squid

    Quando faço "service heartbeat stop" no servido HTTP e no servidor SQUID o servidor HTTP+SQUID faz o takeover dos dois serviços.
    Mas se encerrar essas duas máquinas fisicamente (sem terminar o heartbeat), a terceira máquina so faz o takeover do serviço que parar primeiro. Essa máquina detecta que as outras duas falharam e que desistiram dos recursos mas so faz o takeover da primeira que detecta.


    Não percebo porque funciona bem com a paragem do heartbeat manualmente e com o encerramento das máquinas já não.

    Obrigada

    Nélia

  4. Experimente mandar um email para o Allan Robertson criador do heartbeat

    alanr@unix.sh

    Ele é muito gente fina e responderá para vc.

    Mas, antes dá uma olhada no FAQ do www.linux-ha.org


    []'s

    Marcos Pitanga
    System Engineer
    Gplus Energy - High Performance Computing
    www.gplus.com.br






Tópicos Similares

  1. Duvidas no Heartbeat
    Por Filipa_Nelia no fórum Servidores de Rede
    Respostas: 2
    Último Post: 06-04-2005, 09:38
  2. duvidas no chmod
    Por no fórum Servidores de Rede
    Respostas: 7
    Último Post: 02-07-2003, 16:00
  3. Duvida no registro de dominio...
    Por Fly no fórum Servidores de Rede
    Respostas: 1
    Último Post: 29-04-2003, 13:32
  4. DUVIDA NO LILO
    Por Fabinho no fórum Servidores de Rede
    Respostas: 2
    Último Post: 11-04-2003, 07:41
  5. DÚVIDA NO SQUID!!!!!!!!!!!!!!!!!!!!
    Por BrunoPiaui no fórum Servidores de Rede
    Respostas: 0
    Último Post: 05-11-2002, 17:33

Visite: BR-Linux ·  VivaOLinux ·  Dicas-L