Comunicação e colaboração
O compartilhamento de informações claro o oportuno é um elemento essencial para se responder eficazmente a incidentes, durante todo o ciclo de vida de resposta a incidentes. A comunicação é importante durante todas as fases:
- Detecção: Comunique às pessoas certas que um incidente ocorreu, bem como o impacto e a severidade/natureza ampla do incidente.
- Resposta: Comunique os detalhes sobre o incidente conforme o processo de diagnóstico prossegue, quais são as etapas necessárias para corrigir o problema e quem deve fazer o quê.
- Correção: Comunique como e quando o serviço foi restaurado para a operação normal e as ações de acompanhamento necessárias.
- Análise: Comunique as lições aprendidas com o incidente e o que pode ser feito para impedir que ele aconteça novamente.
- Preparação: Comunique as alterações (ou as alterações necessárias) para o plano de resposta a incidentes, bem como nossos procedimentos e sistemas resultantes das lições aprendidas com esse incidente.
Priorizar para comunicação clara
Anteriormente neste módulo, mencionamos que as organizações de elite/alto desempenho usam uma abordagem proativa, em vez de reativa. Mudar sua postura ao responder a incidentes de reação para resposta eficaz é resultado de priorizar e permitir uma comunicação boa, clara e precisa.
As chaves para priorizar a comunicação clara incluem:
- Verifique se você está compartilhando informações sobre o que está acontecendo em cada etapa.
- Documente as informações: registre-as por escrito para diminuir a probabilidade de mal-entendidos ou esquecimentos.
- Coloque as informações em um local centralizado em que elas possam ser acessadas por todos que precisarem delas.
- Use as ferramentas para aumentar a eficácia das comunicações.
Embora não tenhamos falado isso explicitamente naquele momento, esses são todos comportamentos que demonstramos na última unidade.
Ferramentas de comunicação: ChatOps
Antes de falar sobre as ferramentas de comunicação, você precisa aprender sobre o ChatOps, que não é uma ferramenta específica, mas um modelo de colaboração controlado por conversa. Ele é popular entre os desenvolvedores para reunir pessoas, ferramentas, processos e automação. O ChatOps fornece a você um modo novo e melhor para as equipes trabalharem, aproveitando o chat em grupo, em vez de depender de tecnologias mais antigas, como email, para colaborar.
Em sua forma avançada, o ChatOps pode usar bots e inteligência artificial personalizados para automatizar o trabalho. No contexto de resposta a incidentes, você pode usar o ChatOps para introduzir ferramentas de chat em grupo na conversa. O trabalho feito dessa forma é um forte incentivo para os engenheiros se reunirem no chat em grupo e colaborarem em problemas e incidentes, bem como em trabalhos comuns de engenharia.
O chat em grupo ajuda você a compartilhar mais sobre o que está acontecendo em seu sistema em termos de conhecimento institucional, obtém essas informações das mentes das pessoas e as coloca no chat para que elas possam ser compartilhadas e usadas por outras pessoas.
Isso aumenta a visibilidade e o reconhecimento operacional em toda a equipe e ajuda as outras pessoas a entenderem o que devem fazer. Quando você executa comandos e compartilha no chat o que está fazendo, você está ensinando a outros o que fazer e como fazê-lo.
O aprendizado é resultado de um maior compartilhamento de informações sobre o que está acontecendo na engenharia. Quando você entende mais sobre o que os seus colegas, colaboradores e lideranças estão fazendo e pensando (incluindo o modo como eles tomam decisões), você pode ser mais empático sobre o que está ocorrendo. Tudo isso acontece naturalmente quando você começa a mover seu trabalho para o chat.
Usar o Microsoft Teams em sua solução do ChatOps
Você já aprendeu como o Microsoft Teams pode ser uma parte importante do seu kit de ferramentas de comunicação durante um incidente. Você pode criar uma ponte de conversa com canal dedicado para o incidente e até mesmo usar os Aplicativos Lógicos para automatizar a postagem dos detalhes do incidente diretamente no canal.
Já que o Microsoft Teams é um local centralizado em que temos muitas conversas sobre nossos esforços de engenharia, ele é um bom lugar para começar em sua solução do ChatOps para fornecer atualizações de status e contexto adicional.
Por exemplo, você pode usar um webhook do Teams para atualizar uma página de status. Você pode configurar o Teams para escutar um determinado comando em um chat e, se recebido, enviar uma solicitação para outro aplicativo. Esse aplicativo simples pode ser uma Função do Azure que atualiza uma página HTML estática armazenada no Armazenamento de Blobs do Azure com informações sobre o incidente em andamento. O resultado final é que o comando simples no chat fornece uma atualização para stakeholders adicionais que não estão no chat. Essa etapa simples economiza tempo que, caso contrário, poderia ter sido gasto atualizando as pessoas não envolvidas na resposta.
Até agora, gastamos nosso tempo examinando as fases antes da correção. Agora, vamos focar em maneiras de melhorar essa fase.