+ Responder ao Tópico



  1. #1
    MRovari
    Visitante

    Padrão drbd+heartbeat+mon (dúvidas cruéis)

    Senhores(as),
    Tenho algumas dúvidas em relação ao Trio DRBD+HEARTBEAT+MON:

    Meu Ambiente: Slack9.1 Kernel: 2.4.22 (drbd-0.6.8 + heartbeat-1.0.4 + mon-0.99.2)
    2 máquinas idênticas P166
    slack 1
    eth0 3Com IP 172.16.0.20
    eth1 3Com IP 10.0.0.10
    slack2
    eth0 3Com IP 172.16.0.30
    eth1 3Com IP 10.0.0.20

    Bom, instalei o drbd replicando o dev/hda2, que no meu caso é o /home, daí vem a 1º e 2º pergunta:
    1. Sempre o slack1 é o primary, onde isso pode ser mudado ? Já tentei várias coisas, inclusive colocando
    no slack2 drbdsetup /dev/nb0 primary (obs: estou colocando isso no /etc/rc.d/rc.local.
    2. Quando o slack1 "cair" eu gostaria que o slack2 assumisse tudo, inclusive com o /dev/hda2 sendo o primary, tem como ?

    Bom, instalei o Heartbeat, perfeito: porém surgiram algumas dúvidas:
    3. Fiz um teste com o apache, por exemplo. Quando as máquinas são ligadas o status fica da seguinte forma:
    - slack1 assume com eth0:0 172.16.0.100, sendo assim slack1 fica sendo o master;
    Quando simulo uma queda do HUB, retirando o cabo do do slack1 do HUB, por exemplo, o slack2 assume e fica com eth0:0 172.16.0.100 e neste momento o
    slack1 deixa de ter o virtual eth0:0 172.16.0.100. Perfeito, porém quando retorno o cabo do slack1, o mesmo puxe de volta a responsabilidade de ser o master
    e o slack1 pega novamente o virtual eth0:0 172.16.0.100. Pergunta: Como faço para o slack1 não tentar se reestabelecer como master ?
    4. Reparei que se eu demorar um pouco mais para retornar o cabo do slack1, a interface eth0 do mesmo para de responder, alguém já viu isso ou tem idéia do que pode ser ?
    5. Fiquei intrigado com o seguinte: Na documentação da Sulamita, no final da matéria sobre o mon, diz o seguinte: "Agora se ocorrer algum erro na rede como queimar placa, porta do hub etc etc, o mon disparará o shutdown do heartbeat e levará a outra máquina a assumir o IP e os serviços..." Estranho, no caso isso já acontece mesmo se o mon instalado,ou seja, mesmo sem o mon, quando eu retiro o cabo do slack1 a comutação é feita. Será que entendi algo erroneamente ?

    Bom, instalei o Mon depois de muitas brigas com as CPANs: Estou tendo o retorno da seguinte mensagem no mon-log:
    alert servers ping 1074873408 /usr/local/mon-0.99.2/alert.d/mail.alert (root@loc
    alhost) could not open pipe to fping: No such file or directory
    Alguém saberia me dizer o que pode ser isso ?

    Agradeço muito ajuda desde já.

    Marco Aurelio

  2. #2
    Toskinha
    Visitante

    Padrão drbd+heartbeat+mon (dúvidas cruéis)

    Olá

    Vou colar uma parte de um mail que enviei para a lista de ha que pode lhe ajudar e entender pq seus ultimos testes não funcionam e porque o mon é necessario (realmente preciso atualizar a documentação )

    "Talvez o problema esteja em como vocês estão encarando os testes.
    Veja, se você apenas desconecta o cabo de rede, por exemplo, o
    secundario detecta a falha e assume os serviços. Porém o primario
    detectou que o secundario caiu, mas isto nao afeta o fato de que ele é o
    primário. Quando a conexão é reestabelecida, ele ganha a eleição, afinal
    nunca deixou de ser primário."

    Quanto as outras perguntas:

    1 - voce pode forçar um a ser primario atraves do drbdsetup(mais recomendado) ou pelo parametro inittimeout do drbd.conf (nao muito recomendado, pois existe uma serie de checagems para detectar quem tem os dados mais atuais, quem foi o ultimo primario). Por sua conta e risco
    2 - o heartbeat faz este trabalho, mas não em cima do hda, mas sim do nb0. Se não está fazendo verifique sua configuração.

    E por ultimo, o fping é um programa, precisa ser instalado tb, veja em http://www.fping.com/