Uma conversa que não pára: o Pinguim, o Morcego e o Elefante
Transcrição
Uma conversa que não pára: o Pinguim, o Morcego e o Elefante
Uma conversa que não pára: o Pinguim, o Morcego e o Elefante Uma solução de backup de alta disponibilidade para DataCenter Allan Rodrigo de Lima – CCE/USP – VIII GeINFO Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Agenda Soluções em produção Motivação p/ uma nova solução A “Nova Solução” A Evolução da “Nova Solução” Descrição do cenário atual Trabalhos Futuros Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Soluções em produção Backup Local descentralizado: Feito localmente no servidor Realizado manualmente pelo operador DUMP/RESTORE Utilizava unidades de fitas remotas Mídias utilizadas: DDS, DDS-2, DDS-3, DDS-4, DLT-7000 e DLT-8000 Backup pela SAN: Utilizando 4 unidades de fita SDLT 110/220 Capacidade para 198 fitas → 43TB (nominais) Software Legato (custo da licença em torno de R$ 2000,00) Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Solução descentralizada Esquema de backup descentralizado Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Solução de backup via SAN Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Motivação p/ uma nova solução Automatizar/Centralizar as operações Atender a demanda dos “menos favorecidos” Maior facilidade de operação de backup/restore Maior facilidade de implementação/instalação nos clientes Melhor gerenciamento dos volumes Diminuição da janela de backup Procurar uma solução “sem” custos de software (software livre) Utilizar a infraestrutura instalada Implementação de Alta Disponibilidade** Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Solução Proposta (0) Ø Ø Sistema modular e escalável Utilizar infraestrutura existente Ø Ø Ø Servidores Unidades de fita (DLT-8000 e SDTL) Storage FC (segunda etapa) BACULA + POSTGRESQL + LINUX Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 BACULA BACKUP + DRACULA = BACULA -> “…Ele perambula pela noite para sugar a essência dos computadores…” Ø Bacula é uma solução de backup em rede, projetada para os sistemas *BSD, Linux, Ø Ø Ø Ø Ø Ø Ø Ø Ø Mac OS X, Unix and Windows. Garantir compatibilidade de dados por 30 anos. Licença GPLv2 Open Source (GPLv2) Gerenciamento centralizado Backup/restore pela rede Medias diferentes (Tape, disk, USB, CD/DVD) Confiável Escalável para manipular 10,000 máquinas Modular – 5 elementos principais Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 BACULA BACKUP + DRACULA = BACULA -> “…Ele perambula pela noite para sugar a essência dos computadores…” FILE DAEMON CONSOLE s ndo a com comandos DIRECTOR Atributos dos arquivos DADOS comandos STORAGE DAEMON Atributos dos arquivos DADOS Atributos e localização dos arquivos Catalog Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 A “Nova Solução” Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Precisávamos evoluir… Dificuldades: Gerenciamento do grande número de clientes Gerenciamento do banco de dados de informações Falta de espaço para o armazenamento do banco de dados de informações (~120 GB) Falta de dispositivos de armazemamento e redução quase total da janela de backup, devido ao grande número de clientes SPOF (single point of failure) servidor principal Realizava todas as rotinas. Servidor de banco de dados. Gerenciava todos os nós de armazenamento do sistema. Falta de hardware confiável Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Precisávamos evoluir… Ø Ø Ø Ø Ø Ø Ø Ø Dividir o grande número de clientes em vários servidores Ter um grande espaço em disco (redundante) para o banco de dados de informações Dividir o banco de dados em função dos servidores Hardware confiável Instalação do banco de dados de informações num cluster AD Utilizar ferramentas de adminstração gráficas (GUI) Homogeneidade das midias de armazenamento (disco) O desempenho era algo para se comecar a pensar Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Precisávamos evoluir… Ø Ø Ø Ø Ø Utilização de storages ISCSI Utilização de storage FC Busca de alto desempenho utilizando LVM Busca de alto desempenho utilizando rede de alta velocidade (Gigabit) Busca de alto desempenho realizando tunning do sistema operacional e do banco de dados de informações. Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 A conversa começou assim… Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 1 elefante incomoda muita gente… 2 elefantes incomodam… incomodam muito mais… 3 elefantes… Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Pinguim fala XFS! Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 Mas de onde vem a alta disponibilidade? Ø Confiabilidade de hardware e software nos servidores. Ø Para os profissionais de TI, sistemas de computação são considerados confiáveis quando são previsíveis, exigem um mínimo de manutenção e funcionam sem interrupções para que os usuários possam utilizar os recursos de que precisam oportunamente. Ø Nessa solução são utilizados Ø Ø Ø Ø Ø servidores Compaq DS-20 nos servidores principais que utilizam a versão estável do software baculadirector v. 2.4.4 e servidores Itautec MX-200 com 300GB discos internos SAS em raid 1 nos servidores de banco de dados com Postgresql 8.3 E servidores Itautec LX-200 nos dispositivos de armazenamento. Sistema operacional Linux, distribuição Debian 5. (LVM2) Confiabilidade dos dispositivos de armazenamento Ø STORAGES Ø Ø iSCSI por caminhos diferentes na rede de computadores do datacenter Fibre channel (FC), por caminhos diferentes na SAN do datacenter. Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 O que falta? Ø Um aplicativo que faca a configuração dos servidores de uma forma mais “amigável” Ø Um Aplicativo que seja capaz de detectar a queda de um servidor e redistribua os clientes entre os outros servidores centrais de forma automatizada (ou não). Ø Virtualizar todos os servidores para que em caso de desastre possam ser facilmente recolocados em um site de contingência da forma mais rápida possível. Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009 DÚVIDAS? Muito Obrigado! [email protected] 11 3091-6418 Allan Rodrigo de Lima da Silva - CCE/USP - VIII GeINFO – Setembro de 2009