Boa Tarde pessoal,


Em um trabalho de faculdade, preciso configurar um Cluster Beowulf , só estou tendo problemas na configuração e comunicação do MPICH2, sera que alguem poderia me dar uma ajuda, segue abaixo detalhado todos os passo que fiz:



Minha estrutura (versão) são as seguintes:

SO: CentOS 5.3
Kernel: 2.6.18-164.el5
MPICH: mpich2-1.2

Maquinas que farão parte do Cluster:
mestre
escravo

Ambas estão respondendo dando um ping pelo host name: (p email não fica enorme vou fazer os testes apenas do mestre para o escravo, mas do escravo para o mestre também esta funcionando da mesma forma)

[root@mestre cluster]# ping escravo
PING escravo (192.168.0.201) 56(84) bytes of data.
64 bytes from escravo (192.168.0.201): icmp_seq=1 ttl=64 time=0.172 ms


O rsh esta comunicando:
[root@mestre cluster]# rsh escravo date
Sex Out 23 10:48:23 BRST 2009

NFS, esta montado e consigo gravar excluir nele.

Fiz a compilação e instalação do MPICH2 conforme descrito, e também me apoiei em alguns artigos da internet:

# tar -zxvf mpich.tar.gz
# cd /usr/local/mpich-1.2.7
# ./configure --prefix=/usr/local
# make
# make install

Mas uma coisa que não tenho certeza se é necessário, é que instalei o MPICH2 tb na maquina escravo, e estou configurando á mesma forma que a maquina mestre.

A configuração dos arquivos abaixo não, tenho certeza se estão corretas porque vi muitas forma diferentes de configura-lo na internet

Configurei os arquivo da seguinte forma:

No /etc, foi configurado o mpd.conf, mpd.hosts, com os seguintes conteudos:

[root@mestre ~]# cat /etc/mpd.conf
MPD_SECRETWORD=1234

A senha 1234 é a senha de root de todas as maquinas q compõem o cluster.

[root@mestre ~]# cat /etc/mpd.hosts
mestre
escravo

Este arquivo incluindo os Host Name das maquinas q compõem o cluster.

no arquivo /root/.bash_profile de ambas as maquinas do cluster, inclui as variáveis, veja o conteudo do arquivo:

[root@mestre cluster]# cat /root/.bash_profile
# .bash_profile

# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi

# User specific environment and startup programs

PATH=$PATH:$HOME/bin
export PATH
unset USERNAME

PATH=$PATH=/usr/local/mpich2-1.2/bin
export MPIR_HOME=/usr/local/mpich2-1.2

[root@mestre cluster]#


E tudo indica que as variáveis funcionaram, veja a resposta do which

[root@mestre cluster]# which mpd
/usr/local/bin/mpd

[root@mestre cluster]# which mpiexec
/usr/local/bin/mpiexec

[root@mestre cluster]# which mpirun
/usr/local/bin/mpirun

Agora vamos ao erro:
A partir do mestre quando vou iniciar a comunicação ele me retorna a seguinte:

[root@mestre ~]# mpdboot -r rsh -n 2
unable to open (or read) hostsfile mpd.hosts

Tem idéia do que eu possa fazer p solucionar, e comunicar normalmente?

Me desculpe, pela extensão do email, mas se faz necessário.

Agradeço desde
Wasley Almeida.