+ Responder ao Tópico



  1. #1
    lionhard
    Visitante

    Arrow Ajuda com diskless nodes

    Tenho algumas máquinas sem disco no meu trabalho e estamos pretendendo fazer um cluster de alta performance.
    O que eu quero pedir ajuda a vocês são informações do tipo, como faço pra dar boot nesses nós sem disco. Sei que pode ser feito via tftpboot, por exemplo. Mas qual kernel eu vou usar? O drive da placa de rede tem que estar compilado nesse kernel? Se sim, alguém poderia me fornecer informações de como compilar corretamente este kernel pra dar boot via rede?

    Um outra informação, menos importante mas ajuda também, é quais os daemons no nó central que eu usaria? servidor dhcp, nfs, etc?

    Obrigado

  2. #2

    Padrão

    Se você está usando máquinas mais novas (com placas onboard intel, broadcom, via e até mesmo realtek) provavelmente tem suporte na bios ao protocolo PXE, de forma que pode usar o pxelinux para dar boot nas máquinas através da rede SEM PRECISAR MODIFICAR O KERNEL. Quanto aos drivrs, não é necessário que estejam compilados no kernel se você usar um initrd para carrega-los posteriormente, mas isso depende da estrutura que você pretende usar, se vai ser um cluster beowulf, bproc, openmosix e etc, e como você vai gerenciar a fila/agendamento/distribuição/paralelismo de aplicações.

    No caso da maioria dos tipos de cluster que citei, é interessante possuir um disco, mesmo que compartilhado nas máquinas (é possível rodar a partir da memória RAM, mas na minha opinião somente seria interessante se vc utilizasse opemosix), então você pode usar sistemas de arquivos de rede como o nfs ou outros destinados a alta performance para montar o /.
    No caso de se utilizar o nfs o kernel tem suporte nativo a monta-lo via nfs (ai vc precisa compilar o suporte a placa de rede nele), mas caso queira usar as outras opções será necessário um intrd preparado para isso (sendo carregado, inicializando os módulos necessários, montando o sistema de arquivos e posteiormente executando um pivot_root).

    No servidor (que vamos considerar aqui o gerenciador de processos/recursos) é necessáio, neste tipo de cluster (diskless) que você execute os serviços de dhcp e tftp. Os outros serviços vão depender do tipo de sistema de arquivo e do tipo de "middleware" escolhidos, ou seja, caso esse seu servidor também seja o servidor do sistema de arquivos, e você opte pelo root em nfs será necessário rodar a infra-estrutura de serviços necessários (portmap, nfsd).

    Caso precise de ajuda para produzir um initrd/root na memória pode perguntar, eu tenho alguma experiência no assunto e posso tentar ajudar.

    falow!

  3. #3
    lionhard
    Visitante

    Padrão

    evandrofisico,
    As máquinas não são todas iguais, de forma que algumas tem suporte a PXE e outras não.
    A verdade é que elas tem discos sim, eu usei o termo diskless apenas pra enfatizar que eu não pretendo de forma alguma dar boot pelo disco na máquina, que não vai ter sistema operacional instalado.
    Quanto aos tipos de cluster que você citou, eu não conheço muito bem eles. Na verdade eu cheguei a pesquisar mas nenhum deles me convenceu.
    O meu problema com este cluster não é exatamente o tipo dele, por que a minha dificuldade realmente é fazer eles darem boot pela rede, que não sei exatamente como fazer isso e montar o / do nó central, ou pelo menos as partes que ele vai precisar do nó central, por exemplo, o /home.
    A fila, pretendo usar o torque/openPBS.

    Sei que tenho que rodar um servidor dhcp, um nfs e um tftp a princípio, mas mesmo depois de pesquisar bastante eu não sei como ficaria a configuração deles. Se depois você tiver condições, poderia dar um exemplo? (Tentei algumas maneiras e configurações, mas sem saber como montar um kernel pra boot remoto, as tentativas falharam miseravelmente)
    E sim, eu preciso de ajuda pra criar um initrd.

    Tenho uma outra dúvida.
    Já que essas máquinas são diferentes, eu vou precisar criar um initrd para cada uma delas? E um kernel também?

    Não sei se essa informação faz diferença, mas o nó central vai usar debian sarge.

    Obrigado pela resposta anterior.
    Abraços
    Última edição por lionhard; 13-03-2007 às 11:02.