+ Responder ao Tópico



  1. #1
    Filipa_Nelia
    Visitante

    Padrão Duvida no takeover utilizando Heartbeat

    Oi pessoal,

    Tenho um cluster com tres servidores ligados na mesma rede.
    O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.

    Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
    Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.

    O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.

    Se alguém conseguir me explicar porque isto está acontecendo agradeço
    :?

    Cumprimentos
    Nelia

  2. #2

    Padrão Re: Duvida no takeover utilizando Heartbeat

    Citação Postado originalmente por Filipa_Nelia
    Oi pessoal,

    Tenho um cluster com tres servidores ligados na mesma rede.
    O primeiro servidor corre HTTP, o segundo corre SQUID e o terceiro corre estes dois serviços.

    Fiz um teste para saber se a terceira maquina faz o takeover destes dois serviços quando as outras duas maquinas falham.
    Fazendo "service heartbeat stop" nas duas maquinas, a terceira faz o takeover direitinho e quando faço "service heatbeat start", com auto_failback on, os serviços voltam para as maquinas de origem.

    O meu problema é quando tento fazer o mesmo mas desligando as maquinas sem qualquer cuidado de encerramento como se existisse uma falha real. Neste caso, a terceira maquina faz o takeover do primeiro serviço que falha mas nao faz do segundo. Detecta que ambas as maquinas falharam mas so faz o takeover do primeiro serviço.

    Se alguém conseguir me explicar porque isto está acontecendo agradeço
    :?

    Cumprimentos
    Nelia

    O heartbeat por enquando não possui recurso de cluster N+1, via algoritmo ring, somente trabalha em pares de máquinas.

    Somente existe solućão para isso de forma comercial, se não me engano de steel eyes.

    []s

    Marcos Pitanga
    Linux Clusters Specialist

  3. #3
    Filipa_Nelia
    Visitante

    Padrão Duvida no takeover utilizando Heartbeat

    Peço desculpa, não expliquei bem.
    Na verdade são dois clusters: um com servidor HTTP e outro com servidor SQUID. Existe uma terceira máquina que corre estes dois serviços e pertence aos dois clusters.

    Servidor HTTP:

    /etc/ha.d/ha.cf:
    node servidor1
    node servidor3
    mcast eth0 225.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor1 192.168.85.4 httpd


    Servidor SQUID:

    /etc/ha.d/ha.cf:
    node servidor2
    node servidor3
    mcast eth0 226.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor2 192.168.85.5 squid


    Servidor HTTP+SQUID:

    /etc/ha.d/ha.cf:
    node servidor1
    node servidor2
    node servidor3
    mcast eth0 225.0.0.1 694 1 0
    mcast eth0 226.0.0.1 694 1 0

    /etc/ha.d/haresources:
    servidor1 192.168.85.4 httpd
    servidor2 192.168.85.5 squid

    Quando faço "service heartbeat stop" no servido HTTP e no servidor SQUID o servidor HTTP+SQUID faz o takeover dos dois serviços.
    Mas se encerrar essas duas máquinas fisicamente (sem terminar o heartbeat), a terceira máquina so faz o takeover do serviço que parar primeiro. Essa máquina detecta que as outras duas falharam e que desistiram dos recursos mas so faz o takeover da primeira que detecta.


    Não percebo porque funciona bem com a paragem do heartbeat manualmente e com o encerramento das máquinas já não.

    Obrigada

    Nélia

  4. #4

    Padrão Duvida no takeover utilizando Heartbeat

    Experimente mandar um email para o Allan Robertson criador do heartbeat

    [email protected]

    Ele é muito gente fina e responderá para vc.

    Mas, antes dá uma olhada no FAQ do www.linux-ha.org


    []'s

    Marcos Pitanga
    System Engineer
    Gplus Energy - High Performance Computing
    www.gplus.com.br