| AnteriorTradução de endereço | Protecção - Os sistemas RAID | PróximoInversor |
A tecnologia RAID (acrónimo deRedundant Array of Inexpensive Disks, às vezes Redundant Array of Independent Disks, ou "conjunto redundante de discos independentes") permite constituir uma unidade de armazenamento a partir dos vários discos duros. A unidade assim criada (chamada cluster) tem assim uma grande tolerância às avarias (elevada disponibilidade), ou maior capacidade/velocidade de escrita. A distribuição dos dados nos vários discos duros permite por conseguinte aumentar a segurança e fiabilizar os serviços associados.
Esta tecnologia foi criada em 1987 por três investigadores (Patterson, Gibson e Katz) na Universidade de Califórnia (Berkeley). Desde 1992, é o RAID Advisory Board que gere estas especificações. Consiste em constituir um disco de grande capacidade (por conseguinte, dispendioso) com discos mais pequenos e baratos (ou seja, cujo MTBF, Mean Time Between Failure, ou seja o tempo médio entre duas avarias, é fraco).
Os discos montados de acordo com a tecnologia RAID podem ser utilizados de diferentes maneiras, chamadas Níveis RAID. A Universidade de Califórnia definiu 5, aos quais foram acrescentados os níveis 0 e 6. Cada um deles descreve a maneira como os dados são repartidos nos discos:
Cada um destes níveis constitui um modo de utilização do cluster, em função de:
O nível RAID-0, chamado striping ("entrelaçamento" ou "agregado por banda", às vezes injustamente chamado stripping) consiste em armazenar os dados repartindo-os sobre o conjunto dos discos do cluster. Desta maneira, não há redundância, não se pode por conseguinte falar de tolerância às avarias. Com efeito, no caso de insuficiência de um dos discos, a integralidade dos dados repartidos sobre os discos será perdida.
Contudo, já que cada disco do cluster tem o seu próprio controlador, isto constitui uma solução que oferece uma velocidade de transferência elevada.
RAID 0 consiste assim na justaposição lógica (agregação) dos vários discos duros físicos. Em modo RAID-0 os dados são escritos por “bandas” (em inglês stripes):
|
|
|
Fala-se de factor de entrelaçamento para caracterizar a dimensão relativa dos fragmentos (bandas) armazenados em cada unidade física. O débito de transferência médio depende deste factor (quanto mais pequena é cada banda, melhor é o débito).
Se um dos elementos do cluster for maior que os outros, o sistema de preeencimento por banda será bloqueado quando o disco mais pequeno estiver preenchido. A dimensão final é assim igual ao dobro da capacidade do mais pequeno dos dois discos :
| É recomendado utilizar discos do mesmo tamanho para fazer RAID-0, porque no caso contrário o disco de maior capacidade não será explorado plenamente. |
O nível 1 tem por objectivo duplicar a informação a armazenar sobre vários discos, fala-se por conseguinte de mirroring, ou shadowing, para designar este método.
|
|
|
Por outro lado, a tecnologia RAID1 é muito cara, já que apenas metade da capacidade de armazenamento é realmente utilizada.
O nível RAID-2 é agora obsoleto, porque propõe um controlo de erro por código Hamming (códigos ECC - Error Correction Code), ora este último está agora integrado directamente nos controladores de discos duros.
Esta tecnologia consiste em armazenar os dados de acordo com o mesmo princípio que com o RAID-0, mas escrevendo numa unidade distinta as bits de controlo ECC (geralmente 3 discos ECC são utilizados para 4 discos de dados).
A tecnologia RAID 2 oferece pobres desempenhos mas um nível de segurança elevado.
O nível 3 propõe armazenar os dados sob a forma de bytes em cada disco e dedicar um dos discos ao armazenamento de uma bit de paridade.
|
|
|
|
O nível 4 está muito próximo do nível 3. A diferença encontra-se a nível da paridade, que é feita sobre um sector (chamado bloco) e não a nível da bit, e que é armazenada num disco dedicado. Ou seja, o valor do factor de entrelaçamento é diferente em relação ao RAID 3.
|
|
|
|
Assim, para ler um número de blocos reduzidos, o sistema não tem de aceder a múltiplos leitores físicos, mas unicamente aqueles sobre os quais os dados estão efectivamente armazenados. Por outro lado, o disco que aloja os dados de controlo deve ter um tempo de acesso igual à soma dos tempos de acesso dos outros discos para não limitar os desempenhos do conjunto.
O nível 5 é semelhante ao nível 4, ou seja, a paridade é calculada a nível de um sector, mas repartida sobre o conjunto dos discos do cluster.
|
|
|
|
Desta maneira, o RAID 5 melhora amplamente o acesso aos dados (igualmente em leitura como em escrita) porque o acesso às bits de paridade está repartido sobre os diferentes discos do cluster.
O modo RAID-5 permite obter desempenhos muito próximos dos obtidos com o RAID-0, assegurando ao mesmo tempo uma tolerância às avarias elevada, é a razão pela qual é um dos modos RAID mais interessantes em termos de desempenho e de fiabilidade.
| Sendo o espaço disco útil num cluster de n discos igual a n-1 discos, é interessante ter um grande número de discos para “rentabilizar”o RAID-5. |
O nível 6 foi acrescentado aos níveis definidos por Berkeley. Define a utilização de 2 funções de paridade, e por conseguinte o seu armazenamento em dois discos dedicados. Este nível permite assim assegurar a redundância em caso de avaria simultânea de dois discos. Isto significa que são necessários pelo menos 4 discos para instalar um sistema RAID-6.
As soluções RAID eleitas são geralmente o RAID de nível 1 e RAID de nível 5.
A escolha de uma solução RAID está ligada a três critérios :
Existem várias maneiras diferentes de instalar uma solução RAID sobre um servidor :