Praticamente toda organização possui a preocupação (umas com mais intensidade que as outras) de preservar seus dados e informações. A principal palavra que resume isso é “backup”. A palavra “backup” pode levar a sensação de segurança para a organização, afinal, se alguma coisa ocorrer existe um cópia dos dados que é possível restaurar.

 

Mas como podemos relacionar a proteção dos dados com o seu uso? Este relacionamento existe em quarto níveis bem distintos:

• Nível Inexistente: Os dados não são salvos em cópias de segurança, também conhecidas como backup, ou se são, é de forma precária sem garantia de utilização posterior;
• Nível de Contingência: Os dados são salvos em cópias de segurança, através de procedimentos formais de backup, testes e restauração, porém não existe um acordo temporal para o retorno destes dados em caso de incidente (crise ou desastre). As informações de tornam acessíveis no momento que for possível;
• Nível de Continuidade: Os dados são salvos em cópias de segurança, através de procedimentos formais de backup, testes e restauração. Além disso, existe um acordo temporal para o retorno destes dados em caso de incidente (crise ou desastre) através de um acordo de nível de serviço. Este acordo estabelece o tempo máximo para que os dados estejam disponíveis novamente;
• Nível de Disponibilidade: Os dados possuem um nível de preservação muito elevado, onde as soluções de contingência e continuidade juntas estão oferecendo alta disponibilidade. Durante um incidente, os usuários nem chegam a perceber que estão trabalhando em uma plataforma do tipo site backup.

Como a abordagem deste livro está relacionada à Continuidade de Negócios baseada na Tecnologia da Informação, é importante apresentar mais detalhes dos três principais níveis de relacionamento dos dados com seu uso.

A Contingência é rotineiramente confundida com a Continuidade e, a Disponibilidade é sempre confundida com o acesso a Informação. Então é preciso conceituar bem cada nível, para não haver esse tipo de confusão:

 

CONTINGÊNCIA: As atividades que contemplam a contingência são as mais realizadas pelas organizações. Por mais que ainda existem exceções, a grande maioria realiza procedimentos de contingência, que no ambiente de Tecnologia da Informação dentro de alguns critérios, podemos entender como Backup. Para que este backup ofereça contingência, é necessário:

  • Infraestrutura de backup: para que seja possível tratar adequadamente as informações e ter um mínimo de garantia das mesmas, é importante possuir os dispositivos adequados para realizar backup. Muitas organizações entendem que realizar cópias em mídias como discos magnéticos, CD´s e DVD´s é a melhor forma de fazer backup, pois além de extremamente fácil (o nível do operador de backup é mínimo) é também o de menor custo. Por outro lado, quando se utiliza os dispositivos adequados, além de se ter uma garantia melhor em relação às mídias (são próprias para este fim), os procedimentos são mais refinados e técnicos e logo, mais caros.
  • Políticas de Backup: as políticas de backup estão diretamente relacionadas com o que será copiado, com qual periodicidade, qual o tempo de retenção dos dados, qual a expectativa de tempo de backup e de restauração. As políticas apresentam uma visão geral do backup da organização.
  • Plano de Execução e Testes do Backup: Este plano tem o perfil totalmente operacional, e apresenta os procedimentos que devem ser realizados durante a execução do backup, da restauração de um backup e mesmo nos testes de backup. O teste de backup exige tempo, espaço lógico e um processo de análise crítica, pois é importante avaliar se existem erros nos procedimentos operacionais, nas mídias e nos dispositivos, com a finalidade de garantir que os backup´s estão válidos e que através deles será possível retornar as informações da organização.
  • Auditoria do Backup: é importante para a organização checar, avaliar e sugerir mudanças nos procedimentos de backup. Isso ocorre através da auditoria do backup, onde as evidências dos procedimentos e testes são constantemente avaliadas e criticadas, com a finalidade de assegurar que os controles de backup estão efetivos. Todo processo que é auditado, mesmo que internamente em uma organização, recebe mais atenção dos seus executores e responsáveis, refletindo diretamente na qualidade da execução dos mesmos.

Estabelecido o ambiente contingente através dos procedimentos de backup, a organização atendeu ao primeiro chamado, o de preservar os dados. Mas se o ambiente computacional (servidores, rede de dados, energia elétrica e comunicação) também for afetado por um incidente, é necessário possuir “outros tipos de backup”, como: servidores reservas, ativos de rede e comunicação redundante, etc. Desta maneira, além de garantir a existência dos dados, estará sendo assegurado que eles poderão ser retornados em algum equipamento para uso.

Dentro de todo cenário na Contingência, em nenhum momento se fez menção ao tempo exigido de retorno da informação, ou mesmo qual a quantidade de informação que pode ser perdida se ocorrer um incidente entre os períodos de execução dos backup´s. O foco da contingência é garantir que existam maneiras de salvaguardar os dados e fazer a sua recuperação, independente de tempo de retorno, capacidade suportada ou mesmo quantidade de dados perdidos.

Outra característica da Contingência é que, em boa parte das vezes, ela não atende a plena capacidade da organização, ou seja, os equipamentos definidos para suportarem o ambiente durante uma contingência não possuem e mesma capacidade dos equipamentos de produção, limitando assim a quantidade de usuários que serão atendidos.

Isso é um reflexo da visão que a organização tem em relação à Tecnologia da Informação. Os gestores se perguntam porque gastar um bom montante de dinheiro em um equipamento que somente será utilizado “em caso de emergência”, pois boa parte do tempo ele ficará lá “parado”. Se a sua organização pensa assim, é hora de reavaliar seus conceitos sobre negócios e suas bases operacionais.

 

CONTINUIDADE: A Continuidade é um passo a mais que a Contingência. As atividades envolvidas no oferecimento de continuidade estão diretamente relacionadas às operações de negócio da organização. Isso significa que além de toda a preocupação de um ambiente contingente, existe o compromisso de disponibilizar as informações dentro de períodos acordados com as áreas de negócio. A Continuidade está centrada em manter as operações de negócio ativas.

Imagine uma rede de supermercados com uma crise de Tecnologia da Informação. O primeiro grande impacto é a parada imediata da operação de negócio, pois sem os sistemas nem existe forma rápida e simples de continuar as vendas. A Continuidade está preocupada em retornar as operações de negócio dentro de um tempo máximo, pré-estabelecido. Após este tempo, se as operações não retornarem, existe uma chance muito grande da organização não conseguir recuperar as operações de negócio. Em outras palavras, a perda financeira pode ser grande, que a organização não consegue voltar a operar.

Para fazer este acordo de tempo com as áreas de negócio e relacionar este mesmo tempo a impactos financeiros, a Continuidade necessita de uma análise especial, denominada Análise de Impacto no Negócio (também conhecida como BIA – Business Impact Analisys). Através desta análise é possível desenhar os possíveis cenários de impacto financeiro devidos a incidentes e crises de Tecnologia da Informação.

Além disso, através das técnicas desta análise é realizada identificação dos períodos de tempo suportáveis pelas áreas de negócio. As informações servirão de base para o alinhamento das operações de negócio com as operações de serviços de Tecnologia da Informação.

A Continuidade reside em voltar as operações de negócio dentro deste espaço temporal apresentado pela Análise de Impacto no Negócio e que foram acordados com as áreas de negócio. Em um primeiro momento, essa definição parece mais um Acordo de Nível de Serviço (SLA – Service Level Agreement) da Tecnologia da Informação com as áreas de negócio.

 

DISPONIBILIDADE: As atividades que envolvem a Disponibilidade vão muito além do que a Análise de Impacto de Negócio apresenta, mas possui como base todos os procedimentos adotados pela Contingência e Continuidade. Neste contexto, o conceito de Disponibilidade está diretamente associado à operação praticamente ininterrupta das operações de Tecnologia da Informação que mantém as operações de negócio. Este ambiente também é conhecido como “Alta Disponibilidade”.

Em situações de crises, os usuários dos serviços de Tecnologia da Informação, podem nem sequer notar que houve uma mudança no ambiente. Por outro lado, as equipes de suporte técnico já estão trabalhando para identificar as causas dos problemas e aplicar as soluções necessárias.

Para muitas organizações, o conceito de disponibilidade é uma referência, mas não um objetivo a ser alcançado. Porém, existem organizações que estão envolvidas em processos críticos de negócio, como as das áreas bancárias e financeiros. Estas sim tratam a alta disponibilidade como objetivo contínuo a ser alcançado, mantido e monitorado.

Mas existem limitações nos ambientes de alta disponibilidade: primeiro que é um ambiente de custo muito elevado; segundo que nem todos os componentes dos serviços de Tecnologia da Informação conseguem ter o mesmo nível de disponibilidade. Estas limitações fazem com que a alta disponibilidade seja muito eficiente e eficaz para alguns tipos específicos de crises.

Imagine um ambiente de serviços Web, onde os servidores de aplicação são agrupados de “clusters” de alta disponibilidade. Nesta solução, se um servidor falha, os outros servidores assumem suas funções e o usuário não percebe a mudança. Essa é uma solução prática, de fácil implementação, mas atende especificamente aos serviços Web. Neste mesmo ambiente é necessário analisar o servidor de banco de dados.

Montar “clusters” dos servidores de banco de dados já é uma tarefa complexa, exige um investimento muito maior e por vezes não é realizado. Se a falha ocorrer no banco de dados, o ambiente de alta disponibilidade não atende esta necessidade, a solução será paralisada, assim como a operação deste serviço, restando então ativar a continuidade.