+ Responder ao Tópico



  1. #1

    Padrão Raid 1 no Linux , duvida CABELUDA!

    Ola pessoal!


    Tenho uma duvida aqui que esta me deixando louco.


    Seguinte , todas os clientes da empresa para a que eu trabalho tem servidores rodando RAID 1.

    Um servidor com 2 discos do mesmo tamanho e fazendo espelhamento, ate aqui tudo bem entondo e consigo configurar sem problemas.

    Porem , quando eu desligo a maquina e tiro um disco do Raid a maquina sobe , e quando faco o mesmo com o outro disco, a maquina diz que nao consegue achar o Grub e nao consegue dar o Start no Linux.

    Isso 'e o que nao entendo , os discos deveriam ser uma copia identica um do outro e se um falhar , o outro tem que continuar funcionando , estou cerot?


    Por favor alguem ai poderia matar essa minha duvida?

    Nao estou entendendo.


    Obrigado Daniel

  2. #2

    Padrão

    não entendo muito do assunto, mas o RAID é em software ou em hardware? se for em software, será que ele nao tá fazendo o espelhamento só das partições, em vez do disco inteiro, e aí consequentemente a MBR não está sendo duplicada?

  3. #3

    Padrão

    É o ideal seria antes de tudo saber como está sendo feito o seu RAID, via SW ou HW, e quais
    partições estão no espelhamento.
    Existe um porém para isso pois em alguns casos alguns sistemas de RAID, quando não a maioria, ele tem uma espécie de ponteiro/indexes (me corrijam por favor) e quando vc tem
    2 discos espepelhados (0 e 1), se vc tirar o 1 você terá de dar um comando para sincronia ou re-sincronia entre eles, pois o sistema RAID terá um status de falha.
    Não tenho muita experiência com RAID via software com Linux, mas com Solaris acontecia isso, e, eu não poderia tirar o 0 pois daria este tipo de problema.
    Quando é por HW e são sistemas mais inteligentes um pouco, algumas controladoras já fazem a sincronia ou re-sincronia automática, isso especialmente para storage arrays, aquelas gavetas de discos com 1 ou mais controladoras RAID.
    Mesmo por HW o correto é epserar resincronizar para dai testar e tirar o outro disco.

    Em Softwares como os da antiga Veritas era +/- assim, porém um pouco mais complicado na parte de mão de obra, pois havia um esquema de encapsulamento dos discos, e isso era interessante por alguns lados e por outros nem tanto... Não me lembro bem como era passo-a-passo mas me recordo que não era tão simples!

  4. #4

    Padrão

    Citação Postado originalmente por dlabreu Ver Post
    Ola pessoal!


    Tenho uma duvida aqui que esta me deixando louco.


    Seguinte , todas os clientes da empresa para a que eu trabalho tem servidores rodando RAID 1.

    Um servidor com 2 discos do mesmo tamanho e fazendo espelhamento, ate aqui tudo bem entondo e consigo configurar sem problemas.

    Porem , quando eu desligo a maquina e tiro um disco do Raid a maquina sobe , e quando faco o mesmo com o outro disco, a maquina diz que nao consegue achar o Grub e nao consegue dar o Start no Linux.

    Isso 'e o que nao entendo , os discos deveriam ser uma copia identica um do outro e se um falhar , o outro tem que continuar funcionando , estou cerot?


    Por favor alguem ai poderia matar essa minha duvida?

    Nao estou entendendo.


    Obrigado Daniel
    Amigo, o pouco que eu entendo, o espelhamento e re-construção de dados entre hd´s, você pode usar o raid 5, que faz espelhamento entre 3 hd´s ou mais. abraço

  5. #5

    Padrão

    Sem querer ser mala ... mas completando a informação do "beirsdorf" o RAID 5 tem de ser feito com no mínimo 3 discos. Explicando de maneira bem básica o funcionamento do RAID5 é a escrita distribuida de paridade de informação de dados entre os discos que fazem parte deste RAID, de modo que no momento de gravação ele funciona +/- assim :

    |====================|
    |disco1|disco2|disco3|
    |====================|
    | dado |dado | parid.|
    |--------------------|
    |parid.|dado | dado |
    |--------------------|
    | dado |parid.| dado |
    ======================

    Desta forma o algorítimo do RAID5 irá dirtribuir um dado de paridade em cada disco e que
    quando um destes vir a parar de funcionar, a controladora irá recuperar as informação contidas neste disco através do cálculo de paridade.

    Problema, você não poderá perder mais de um disco pois se dois discos pararem de funcionar,
    ao mesmo tempo ou até a troca e re-construção do primeiro você perderá o volume todo.

    Solução para este caso, existem controladoras RAID que pode criar um disco para ser um "spare" do seu volume em RAID5, e neste caso e com boas e caras controladoras o disco de "spare" irá automaticamente assumir o lugar do primeiro disco que parou de funcionar, através da de-construção, de maneira automática.

    Esse tipo de configuração é muito comum em gabinetes de armazenamento de dados os "Storage Arrays", que visam ter uma maior disponibilidade do ambiente, onde inclusive se pode ter mais de uma controladora RAID no mesmo Storage e neste ainda pode ser conectados gavetas de disco do tipo JBOD (gavetas sem controlador RAID) para aumentar a capacidade, mas sendo administrados pelas controladoras do Storage principal.

    Acho que pude ajudar um pouco e espero não ter causado mais dúvidas, além de poder compartilhar um pouco do que eu conheço e já trabalhei!

    abs a todos !


  6. #6

    Padrão Todo Bom Raid 1 é feito...

    Blza mans!

    Raid 1, é sempre interessante ser feito com 3 discos. Mas Pq 3 o Custo num vai ser muito alto ??? SIM.

    "Perda" de dois discos, Mas todo bom Raid 1 é feito no minimo com três discos, 2 em produção e 1 no modo Spare, porém quando 1 parar outro Levanta sem danos ao seu RAID, depois tu desliga a máquina e substituí o defeituoso, Se o administrador tivesse pensando nesta situação teria evitado este problema e claro, lembrando que quando um raid1 para tenha a esperança de que o disco que parou foi o segundo pois se foi o primeiro você perde o raid, se não tiver spare.

    abraços

  7. #7

    Padrão Depende

    (muita gente falou mas ninguém explicou o que aconteceu)

    Se você tem uma Raid criada via hardware (na controladora), o sistema (independente qual) geralmente detecta um único disco, e a distribuição dos dados no array será a cargo da controladora. Se um disco está off-line (no caso de uma Raid 1, 5 ou 6) ela entrega o dado solicitado ainda que o disco original não esteja presente. Porém, se a Raid é via software, isso não é transparente, e é gerenciado inteiramente pelo sistema operacional.

    Assumindo que você fez uma Raid 1 via software _E USOU UMA CONTROLADORA SATA OU IDE_, se o seu disco 0 (o principal) falhar, os seus dados ainda estarão seguros no disco 1. Porém o sistema não bootará pois o HD responsável pelo boot (no caso, suponho um SDA1 ou HDA1) não existe mais, apenas o SDB1/HDB1. Você precisaria corrigir isso no Grub manualmente para o sistema subir no disco que restou.

    Numa controladora SCSI (nunca testei numa SaS) isso geralmente não acontece, pois se um disco fica offline ele perde a sua ID, e o próximo passa a ser encontrado pelo SO como o primeiro disco (um SDB vira SDA), e o sistema estaria apto a bootar como se nada tivesse acontecido, pois seu disco estaria espelhado.

    O que eu faço: Sempre que crio Raid 1 via software, eu separo a /boot (ítem obrigatório em Raids 0, 5, 6 ou LVM, caso contrário o Grub não "entende" os dados existentes e não boota) para que esta não se misture no resto do sistema. E nela eu configuro o Grub individualmente nos dois discos. Caso um desses discos venha a queimar, no próximo reboot o outro assume e funciona legal.

  8. #8

    Smile

    mas na prática, como se faz um raid 1? o que é preciso?, uma placa mae + 2 hds sata é possível?

  9. #9

    Padrão

    Possível é, eu só não recomendo. Micrão não é servidor. Compre um servidor e escolha uma boa controladora Raid para fazer via hardware, se possível com suporte a Hot Swap. (eu gosto das Adaptecs, bom custo x benefício). Se você quiser fazer Raid via software, até com um HD é possível (para fins de experiência, deixo claro) dividindo em duas partições. Mas aí você perde em processamento e perde o hot swap. Se sua empresa pode se sujeitar a downtime...

  10. #10

    Padrão

    Citação Postado originalmente por timmerman Ver Post
    Possível é, eu só não recomendo. Micrão não é servidor. Compre um servidor e escolha uma boa controladora Raid para fazer via hardware, se possível com suporte a Hot Swap. (eu gosto das Adaptecs, bom custo x benefício). Se você quiser fazer Raid via software, até com um HD é possível (para fins de experiência, deixo claro) dividindo em duas partições. Mas aí você perde em processamento e perde o hot swap. Se sua empresa pode se sujeitar a downtime...
    Fique bem claro, tenha uma controladora de reserva igualzinha, mas igualzinha mesmo até a versão se for 00001 e a outra for 00001.1 não funfa qnd for substituir, então se tiver suporte com uma empresa deixe isto bem claro no contrato, ja perdi um raid 10 por faltar esta pequena clausúla, OK

    abraços

  11. #11

    Padrão

    Citação Postado originalmente por caicarabruno Ver Post
    Fique bem claro, tenha uma controladora de reserva igualzinha, mas igualzinha mesmo até a versão se for 00001 e a outra for 00001.1 não funfa qnd for substituir, então se tiver suporte com uma empresa deixe isto bem claro no contrato, ja perdi um raid 10 por faltar esta pequena clausúla, OK

    abraços
    E fique bem claro também de não atualizar o firmware de uma placa que esteja em produção ou que já possua algum array configurado. Já atualizei o de uma PERC e perdi o array Raid 5 que tinha nela, a minha sorte é que nos discos só ficavam o sistema operacional, o resto estava em storage.

  12. #12

    Padrão

    Citação Postado originalmente por timmerman Ver Post
    E fique bem claro também de não atualizar o firmware de uma placa que esteja em produção ou que já possua algum array configurado. Já atualizei o de uma PERC e perdi o array Raid 5 que tinha nela, a minha sorte é que nos discos só ficavam o sistema operacional, o resto estava em storage.
    não entendi muito bem, vc diz no caso de uma controladora queimar e vc querer resucitar o servidor, vc tem que colocar uma identica , até no firmware afim de que o sistema reconheça a nova placa e trabalhe de novo com raid?

  13. #13

    Padrão

    Citação Postado originalmente por beirsdorf Ver Post
    não entendi muito bem, vc diz no caso de uma controladora queimar e vc querer resucitar o servidor, vc tem que colocar uma identica , até no firmware afim de que o sistema reconheça a nova placa e trabalhe de novo com raid?
    Se você quiser reconhecer aquele seu array novamente, sim... Caso contrário você troca a sua placa por outra, mas ele não detectará a Raid existente. (não sei no caso de uma Raid 1, mas com Raid 0 ou 5 é assim). Não dando margem à Murphy, mas eu nunca vi uma controladora queimar. A única vez que perdi um array foi atualizando o firmware de uma controladora, com a finalidade de padronização de parque. Perdi o array. Então nem prosseguí nos outros, uma hora que houver atualização no sistema operacional e eu precisar reinstalar tudo do zero, aproveito e atualizo as placas também...

  14. #14

    Padrão EU JA

    Citação Postado originalmente por timmerman Ver Post
    Se você quiser reconhecer aquele seu array novamente, sim... Caso contrário você troca a sua placa por outra, mas ele não detectará a Raid existente. (não sei no caso de uma Raid 1, mas com Raid 0 ou 5 é assim). Não dando margem à Murphy, mas eu nunca vi uma controladora queimar. A única vez que perdi um array foi atualizando o firmware de uma controladora, com a finalidade de padronização de parque. Perdi o array. Então nem prosseguí nos outros, uma hora que houver atualização no sistema operacional e eu precisar reinstalar tudo do zero, aproveito e atualizo as placas também...
    Eu Já, e não foi apenas uma que queimou, estava em produção num storage de alta criticidade "criticidade ahsuashuas", quano derrepente, cai uma arvore no cabos de eletricidade do prédio, até ai tudo bem nós somos Josef Climber, No Break Central, Fora os nobreaks por máquina, mas derrepente ouve-se um estouro, os tranformadores do nobreak central pega fogo, até ai tudo bem bombeiros controlam a situação, desligando o nobreak, mas tudo bem nós somos Josef Climber, mas tinhamos outra situação de emergencia imagine um data center dependendo de apenas nobreaks locais, ai vamos olhar os níveis das baterias, pensem nunca foram trocadas 10 anos trabalhando ali huahsuas, começamso a ouvir os bips, e os estalinhos dos nobreaks desligando. Tudo bem nós somos Josef Climber.

    Quanto tudo votou ao normal, 7 horas depois, vimos que algumas máquinas não subiam, e o pior a maioria era storage, conlcusão.

    tivemos que torcar 5 controladoras totalizando um espaço total de 25 teras hasuhasuhas, o cara dos back ups ficou a noie fazendo restores, tudo bem ele é Josef Climber .

    Foram pro Espaço, Raid 0(Proxy), 2 raid 1 Storage BD, 3 Raid 10 Pro saco.

    Empresa que fornecia o hard não cumpriu contrato, pois não tinham as controladoras identicas nos ferramos, e processamso eles.

    Abraços

    Fica ai a lei de murph

    Bruno
    Última edição por caicarabruno; 13-04-2009 às 12:45.

  15. #15

    Talking

    Eu fiquei até sem palavras, incluiria "manutenção do Sal Grosso e Arruda" às rotinas de administração desse data-center :P

  16. #16

    Padrão

    quando e onde vai ser msm? quanto custará? estou interessado...

  17. #17

    Padrão

    Citação Postado originalmente por timmerman Ver Post
    Eu fiquei até sem palavras, incluiria "manutenção do Sal Grosso e Arruda" às rotinas de administração desse data-center :P

    mano tem de tudo aqui cara, pegamos no meio do caminho e estavamso botando em ordem tudo, ai deu estes probleminhas

  18. #18

    Padrão

    Vou ter de concordar com a inclusão na manutenção de Arruda e Sal Grosso.... rsss

    Mas sobre as controladoras, eu não sei quanto as controladores de servidores, mas eu já tive casos onde o storage sempre trabalhou , digamos "manso, no sossego". Quando se necessitou de uma migração para um novo sistema, o bicho pegou e o sotrage começou a trabalhar no máximo possível. Foi ai que começaram a queimar alguns discos e por fim controladoras tb...

    Não perdemos volumes algum, mas antes de colocar era feito uma atualização do firmware da controladora e depois ela já assumiria seu lugar, maasss, o storage tinha uma segunda controladora e isso com certeza ajudou, e muito !!! Seria quase o Joseph Climber naquela época... rsssss

    Mas vale apena lembrar que para sistemas de armazenamento de ambiente crítico, quanto maior os itens de redundância melhor .... pelo menos eu acho .....