Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I SAN (Storage Area Network) NAS (Network Attached Storage) DAS (Direct Attached Storage) 1020552 – Jorge Silva 1020578 – Nuno Carvalho Índice Índice ................................................................................................................................ 3 Introdução ......................................................................................................................... 4 Armazenamento Directo ................................................................................................... 6 DAS (Direct Attached Storage) .................................................................................... 6 Armazenamento desligado (Detached Storage) ............................................................... 7 SAN (Storage Area Network) ...................................................................................... 7 NAS (Network Attached Storage) .............................................................................. 10 Fibre Channel ................................................................................................................. 12 iSCSI............................................................................................................................... 12 3 Introdução No mundo dos negócios, só é possível atingir os resultados traçados à medida em que os dados necessários para a tomada de decisões podem ser acedidos pelas empresas. Para que isso possa ocorrer, é preciso que os dados estejam armazenados com segurança e disponibilidade. Por esta razão, é vital contar com uma gestão que garanta bons níveis de performance e protecção, que deve suportar desde falhas durante o armazenamento (storage media) até elaborar procedimentos completos em caso de problemas mais graves (disaster recovery). Em ambientes com um computador central (host-centric), a gestão de armazenamento é centralizado. Os dispositivos de armazenamento são ligados directamente ao computador. Com o aparecimento do modelo de computação Cliente/Servidor, trouxe consigo novas necessidades no sistema de gestão de armazenamento. A informação que era centralizada num ambiente com computador central passou a estar espalhada pela rede. Os dispositivos de armazenamento, neste modelo, também estão ligados a máquinas individuais e o aumento de capacidade deve ser traçado máquina por máquina, inclusive variando conforme a plataforma. É possível visualizar estes ambientes como "ilhas de informação", como mostrado na figura abaixo. A informação que está numa ilha dificilmente pode ser acedida por outras ilhas, dificultando o acesso aos dados. Figura 1 – Ilhas de informação 4 A indústria tem reconhecido por décadas a lacuna entre a apresentação, o processamento e o armazenamento dos dados. A arquitectura Cliente/Servidor é baseada nestes três níveis: O nível mais alto utiliza o desktop para a apresentação dos dados. O desktop é baseado em computadores pessoais ou computadores de rede. No nível intermédio, servidores de aplicação realizam o processamento. Os servidores de aplicação são acedidos pelo desktop e utilizam os dados armazenados no nível mais baixo. O nível mais baixo consiste nos dispositivos de armazenamento que contêm os dados. Este trabalho segue os princípios referidos em cima, abordando o tema de redes de armazenamento directo ligado e armazenamento desligado. Em relação ao armazenamento directo ligado, trata-se de DAS (Direct Attached Storage) e em relação ao armazenamento desligado (Detached Storage), trata-se de SAN (Storage Area Network) e NAS (Network Attached Storage). Para a implementação destes armazenamentos são utilizadas as tecnologias mais frequentes, ou seja, iSCSI e Fibre Channel, as quais também são enunciadas neste trabalho. 5 Armazenamento Directo DAS (Direct Attached Storage) Trata-se provavelmente da solução mais comum de armazenamento em disco rígido em instalações de pequena e média dimensão. O disco rígido está instalado no computador que executa a aplicação (o servidor de aplicações). A limitação depende da capacidade do computador e do número máximo de discos rígidos que o mesmo pode suportar. A maior parte dos computadores suporta dois, sendo que alguns suportam até quatro discos. A capacidade de cada disco é aproximadamente de 300 GB. Deste modo, a capacidade total de disco rígido é aproximadamente de 1,2 TB (Terabyte). Figura 2 - Direct Attached Storage 6 Armazenamento desligado (Detached Storage) Nas aplicações em que a quantidade de dados armazenados e outros requisitos excedam as limitações de um DAS (Direct Attached Storage), é implementado um sistema de armazenamento em separado. Estes sistemas são designados por SAN (Storage Area Network) e NAS (Network Attached Storage). A diferença entre ambos reside no facto de SAN fornecer armazenamento em blocos para partilha de capacidade entre servidores e estações de trabalho. Por outro lado, NAS fornece armazenamento de ficheiros para partilha de ficheiros entre servidores e estações de trabalho. Este tipo de configuração de disco rígido permite soluções de disco rígido de grande dimensão e escaláveis. SAN (Storage Area Network) Uma SAN é uma rede (ou sub rede) de alta velocidade que interliga diferentes tipos de dispositivos de armazenamento de dados com servidores de dados para satisfazer as necessidades de um determinado grupo de utilizadores. Uma SAN é normalmente agrupada em proximidade com outros recursos de computação, como por exemplo: mainframes, mas também podem ser implementados em locais remotos para backup e arquivação, usando para isso tecnologias WAN. As SAN suportam disk mirroring, backup e recuperação, arquivação e acesso a dados arquivados, migração de dados de um dispositivo de armazenamento para outro, e a partilha de dados entre diferentes servidores numa rede. As SAN também podem incorporar sub redes com sistemas NAS. A SAN poderia ser definida como uma rede de alta velocidade, comparada à LAN (Local Area Network), que permite o estabelecimento de ligações directas entre os dispositivos de armazenamento e processadores (servidores) centralizados à extensão suportada pela distância das fibras ópticas. A SAN pode ser vista como uma extensão do conceito que permite que os dispositivos de armazenamento sejam compartilhados 7 entre servidores e interligados entre si. Uma SAN pode ser compartilhada entre servidores ou dedicada a um servidor local ou remoto. As interfaces de SAN podem ser: ESCON (Enterprise Systems Connection) SCSI (Small Computer Systems Interface) SSA (Serial Storage Architecture) HIPPI (High Performance Parallel Interface) FC (Fibre Channel) Qualquer outra nova interface emergente A figura abaixo mostra uma visão geral de uma SAN ligando vários servidores a vários sistemas de armazenamento. Figura 3 – SAN As SANs criam novos métodos de ligação de armazenamento aos servidores. Estes novos métodos prometem uma notável melhoria em performance e disponibilidade. As SANs são usadas para ligar conjuntos de armazenamento compartilhados a vários servidores, e são usadas por servidores em ambiente de cluster para fail over. Elas podem interligar discos ou fitas de mainframe a servidores ou clientes de rede e podem criar caminhos paralelos de dados para ambientes de computação e de alta largura de banda. A SAN é uma outra rede que difere das redes tradicionais, porque foi concebida a partir de interfaces de armazenamento. 8 Além disso, a SAN pode ser usada para contornar os conhecidos gargalos de rede, pois suporta directamente altas velocidades de transferência de dados entre os servidores e dispositivos de armazenamento nas seguintes formas: Servidor para storage: é o modelo tradicional de iteração com os dispositivos de armazenamento e cuja vantagem é que um mesmo dispositivo de armazenamento pode ser acedido em série ou em paralelo por múltiplos servidores. Servidor para servidor: no qual a SAN pode ser usada para alta velocidade e comunicações de alto volume entre servidores. Storage para storage: permite a movimentação dos dados sem intervenção do servidor, libertando o processador para outras actividades. Por exemplo: um disco pode realizar o backup de dados para uma fita sem a intervenção do servidor ou um mirror de dispositivo remoto através da SAN. O uso de SANs gera uma melhoria de performance das aplicações, por exemplo, permitindo que os dados enviados directamente do dispositivo de origem ao dispositivo de destino, não requeiram intervenção do servidor. As SANs também habilitam novas arquitecturas de rede nas quais vários computadores (hosts) acedem a vários dispositivos de armazenamento ligados na mesma rede. De seguida, são apresentados outros benefícios que o uso da SAN pode oferecer às empresas: Mais disponibilidade: armazenamento independente de aplicações acessíveis através de caminhos alternativos de dados. Alta performance: os dados são descarregados do servidor e movidos para uma rede independente. Armazenamento centralizado e consolidado: gestão mais simples, escalabilidade, flexibilidade e disponibilidade. Transferência e armazenamento: cópia remota de dados habilitada para protecção contra falhas e desastres. Gestão centralizada mais simplificada: a imagem simples do meio de armazenamento simplifica a gestão. 9 NAS (Network Attached Storage) NAS, Network Attached Storage, refere-se a uma solução de hardware e software que compõe um servidor específico para armazenar e gerir dados. Esse equipamento dedicado possui interface de rede e serviços embutidos que o deixam pronto para ser ligado à rede. Esta solução é direccionada a empresas que precisam aumentar a capacidade de armazenamento de seus servidores, sem acrescentar discos rígidos ou montar um outro servidor com mais discos. Em alguns casos, adicionar mais discos pode não ser conveniente por falta de espaço ou pelo comprometimento do desempenho geral do servidor. Mas comprar novos equipamentos, programas e licenças para construir um servidor pode ser caro ou demorado. O servidor NAS é um exemplo de thin server, ou seja, um computador que tem todas as funções de um servidor, mas possui arquitectura optimizada para a aplicação a que se dedica. Como consequência, componentes considerados supérfluos para o desempenho de sua função são eliminados, tornando o computador mais barato. O barramento interno e os controladores de acesso às unidades de armazenamento são optimizados visando maior desempenho. O resultado é uma solução atraente que une bom preço à confiança e grande capacidade de partilha. Aplicações: • Servidores de Arquivos; • Partilha de Informações, FTP, e-mail, CAD e Web. Benefícios: • Performance moderada; • Baixo de Custo de Conectividade; • Preservação de Investimento existente da LAN. 10 Figura 4 – Exemplo de duma implementação NAS numa rede Storage 11 Fibre Channel Até ao momento, é esse o padrão de ligação mais rápido disponível comercialmente, chegando a 400 MB/s (com a promessa de atingir 1 GB/s) e suportando até 126 dispositivos ligados. Porém, não faz parte da vida dos utilizadores normais. Fibre Channel é o único padrão que inclui a fibra óptica, além do fio de cobre, como meio de transmissão. Graças às propriedades da fibra óptica, um cabo pode atingir 10 km de extensão, ao contrário dos outros padrões, nos quais os cabos frequentemente não podem ter mais do que cinco metros. Aceita diversos esquemas de ligação e frequentemente é chamado pelo nome do esquema de ligação mais conhecido, FC-AL (Fibre Channel-Arbitrated Loop). O Fibre Channel é indicado para ambientes de rede que necessitem de altíssima performance para armazenamento massivo de dados em servidores. iSCSI Ainda limitada no requesito distância, a tecnologia ISCSI promete fazer frente ao padrão fibre channel com um grande apelo, menos investimento para sua implementação. É correcto afirmar, no entanto, que o fibre channel tem vantagens tanto na presença de canais de dados redundantes – num formato comutado – como é compatível com distâncias muito maiores que o SCSI, chegando até 10 quilómetros. O fibre channel foi desenvolvido a partir da necessidade de uma rede de armazenamento rápida, dedicada e robusta. Mais recentemente, os avanços na tecnologia de Ethernet, juntamente com o desejo de simplificar as exigências de formação, hardware e suporte, têm tornado possível a tecnologia iSCSI (SCSI para internet). A ideia é ter tudo disponível num único tipo de plataforma de rede. Esse cenário não quer significar, necessariamente, que o tráfego de armazenamento pode fluir na mesma rede aonde estão os dados. Em geral, uma SAN corporativa existe como uma entidade separada da infra-estrutura de dados. Na verdade, do ponto de vista 12 da implementação, as redes de armazenamento com base na tecnologia iSCSI continuam sendo uma entidade separada. O grande argumento para a utilização da tecnologia iSCSI é sua implementação de baixo custo. Com a economia presente em diversas formas, com ênfase na utilização de tecnologias comuns entre a rede geral de dados e a estrutura de armazenamento, o que reduz a necessidade de formação e de pessoal. Mas, o verdadeiro ponto de venda da solução é a capacidade de impulsionar a infraestrutura TCP/IP já existente e de fácil percepção, a fim de construir as redes de armazenamento. Com os avanços nas áreas de QoS (Quality of Service -> qualidade de serviço) e segurança, a oportunidade de partilhar o armazenamento com a arquitetura pré-existente representa uma significativa economia de custo em termos de hardware, formação e implementação. Com a Ethernet atingindo maiores capacidades, mesmo operando sobre cobre é possível ter uma rede de armazenamento de 1 Gb, sem modificar sua infra-estrutura. Uma das grandes barreiras é a impressão generalizada que a tecnologia iSCSI pode destruir a rede geral de dados. E essa é uma preocupação realista, se o tráfego de armazenamento da companhia for elevado e não possuir mecanismos para o tráfego de armazenamento geral de dados, tudo pode desmoronar. Em algumas situações, como quando são utilizados pequenos servidores, compartilhar as ligações de armazenamento de dados com as ligações do tráfego geral de dados pode ser uma boa alternativa. Contudo, na maioria dos casos, isolar este tipo de tráfego por IP para a própria rede é uma opção melhor. As estruturas de armazenamento são uma extensão natural das redes de IP. Portanto, uma infra-estrutura com base em IP é inevitável e existe "às custas" de outras tecnologias, como a fibre channel. Ao mesmo tempo que o fibre channel atinge em seu novo padrão velocidade de 2 Gb, a tecnologia Ethernet chega a capacidade de 10 Gb e começa a disseminar-se, em especial no mercado norte-americano, as ligações iSCSI emergem como o padrão dominante no futuro das redes de armazenamento. 13 Na maioria das implementações envolvendo a tecnologia iSCSI, é preciso montar uma ponte entre uma rede de armazenamento fibre channel, ou várias dessas redes, e a sua rede de IP, interligando sectores independentes de redes de armazenamento. Visualizadas em separado, mesmo em diferentes edifícios, as redes de armazenamento podem ser interligadas utilizando-se iSCSI na rede pré-existente. As técnicas para "espelhar" (mirroring) todos os seus dados e fazer backups remotos são mais fáceis com a tecnologia iSCSI, porque têm como base o IP. O armazenamento sobre IP será "a onda do futuro", e esperamos que o iSCSI esteja "na crista dessa onda". 14