Recomendações para formalizar tarefas rotineiras e não rotineiras

Aplica-se a esta recomendação de lista de verificação de Excelência Operacional do Azure Well-Architected Framework:

OE:02 Formalize a maneira como você executa tarefas operacionais de rotina, conforme necessário, e de emergência usando documentação, listas de verificação ou automação. Procure consistência e previsibilidade para os processos e entregas da equipe adotando práticas e abordagens líderes do setor, como uma abordagem de mudança para a esquerda.

Este guia descreve as recomendações para formalizar tarefas rotineiras e não rotineiras. Equipes de carga de trabalho eficientes e bem-sucedidas têm práticas consistentes e previsíveis de gerenciamento de carga de trabalho. Otimize a eficiência e a consistência adotando ferramentas e práticas comprovadas pelo setor e automatizando processos quando for prático. Ao ser consistente sobre como as tarefas de rotina, improvisadas e de emergência são tratadas, você minimiza o risco de não estar preparado quando surgem problemas. Ao adotar uma abordagem de melhoria contínua para o gerenciamento da carga de trabalho, você aumenta a consistência e a eficiência da sua equipe durante todo o ciclo de vida da carga de trabalho.

Principais estratégias de design

Processos consistentes tornam a qualidade do seu trabalho previsível, e a qualidade previsível do trabalho torna o suporte à carga de trabalho mais suave. Para obter consistência em seus processos, você precisa ser intencional e explícito sobre como executar processos em padrões padrão. Use estratégias como automação e abordagens shift-left para minimizar potenciais áreas de imprevisibilidade.

Padronizar processos

A padronização de processos assume muitas formas. Descrever todas as maneiras pelas quais você pode abordar a padronização está fora do escopo deste guia, mas algumas recomendações gerais incluem:

  • Os processos padronizados devem abranger todos os aspetos do gerenciamento de carga de trabalho: confiabilidade, segurança, otimização de custos, desempenho e processos operacionais. A equipe de carga de trabalho deve ter tanta propriedade dos processos quanto precisa para manter e melhorar continuamente a carga de trabalho sob a governança geral da organização.

  • A documentação que você produz captura seus procedimentos operacionais padrão e dita como as coisas são feitas, mas a documentação nunca é final. Os procedimentos devem evoluir à medida que sua carga de trabalho e sua equipe evoluem. Analise e desafie regularmente os padrões para garantir que eles sejam os padrões certos para sua equipe no momento. Sua documentação deve ser modelada e a versão controlada para garantir a consistência nos formatos de documentação e que haja um registro de revisões e atualizações. O controle de versão também ajuda a reforçar os requisitos de que a equipe realize revisões da documentação em intervalos agendados regularmente.

  • Divida tarefas rotineiras, improvisadas e de emergência em itens de lista de verificação que sejam fáceis de entender. Um exemplo de uma tarefa de rotina é o processo de aplicação de uma atualização a uma dependência de código aberto. A carga de trabalho pode precisar usar uma biblioteca de código aberto como um SDK para usar um serviço de mensagens de terceiros. Este SDK deve ser atualizado regularmente para patches de segurança, correções de bugs e melhorias de funcionalidade.

    Quando você determina que precisa de uma atualização, a equipe de carga de trabalho pode ter uma lista de verificação que inclui itens como testar a atualização em ambientes inferiores, criar uma solicitação de gerenciamento de alterações para implantar a atualização em produção e atualizar a documentação, como um wiki ou uma base de dados de conhecimento, para garantir que eles reflitam a versão correta. Concentre cada item da lista de verificação em uma tarefa discreta claramente definida.

  • As tarefas improvisadas e de emergência são específicas de cada cenário, mas os operadores devem ainda compreender claramente os seus papéis e responsabilidades. Eles precisam saber como interagir com a equipe de carga de trabalho e com outras equipes da organização para trabalhar com eficiência nesses tipos de tarefas.

    Por exemplo, uma tarefa improvisada pode implantar um novo tipo de recurso, como um serviço de aprendizado de máquina, que foi aprovado para aprimorar a funcionalidade da carga de trabalho. Pode não haver uma lista de verificação totalmente realizada para a implantação e teste desse tipo de recurso. No entanto, deve haver listas de verificação gerais para adicionar novos recursos à sua infraestrutura como modelos de código e padrões que abrangem testes de infraestrutura, desempenho, segurança e confiabilidade em cada estágio da cadeia de promoção.

    Da mesma forma, o seu plano de resposta a emergências deve definir claramente papéis e responsabilidades e processos e procedimentos gerais. Você deve aderir a este plano em situações de emergência para garantir que você lida com eles de forma eficiente.

    Operações improvisadas e de emergência também são boas oportunidades para aprender a melhorar seus procedimentos operacionais padrão. Peça à equipe de carga de trabalho que reflita sobre como as operações poderiam ter sido mais suaves e determine se uma atualização dos processos existentes pode ser benéfica no futuro.

Adote práticas comprovadas pelo setor

  • Adote práticas comprovadas pelo setor para minimizar o tempo que sua equipe gasta na invenção de processos e padrões. Seguir práticas ágeis com o Scrum, organizar seu trabalho através de quadros Kanban e adotar um ethos shift-left são exemplos de práticas que foram desenvolvidas ao longo de muitos anos e se mostraram eficazes para organizações de qualquer tamanho. Muitas organizações maduras usam procedimentos operacionais padrão controlados por versão, wikis, novos manuais de funcionários e manuais de operações para impor consistência.

    Confie na experiência da sua equipe para decidir quais práticas se ajustam ao gerenciamento do ciclo de vida da sua carga de trabalho. Aprenda com outras equipes sobre os padrões que implementaram com sucesso para entender como determinadas práticas se encaixam em sua estrutura organizacional.

    Neste contexto, um ethos shift-left significa que as equipas de carga de trabalho devem ser capacitadas para procurar medidas que possam melhorar a segurança, fiabilidade e eficiência de custos da carga de trabalho. Em seguida, eles adicionam essas medidas de melhoria à sua própria lista de pendências, em vez de transferir a responsabilidade para equipes externas.

    Por exemplo, um teste exploratório pode descobrir uma área para melhoria na segurança que pode não ter sido descoberta até ser exposta por verificações de segurança, que acontecem mensalmente ou até com menos frequência. Incentive a equipe de carga de trabalho a assumir a responsabilidade da carga de trabalho em todos os aspetos de seu ciclo de vida e contribuir para sua melhoria contínua de forma proativa, em vez de depender de outras equipes.

Aproveite os padrões e recursos centralizados

  • Incorpore requisitos organizacionais e funções transversais em seus procedimentos operacionais padrão. Sua organização pode ter padrões para alguns processos que você deve adotar. No entanto, você também pode ser capacitado para desenvolver seus próprios padrões para outros processos, portanto, procure maneiras de incorporar os padrões necessários em seus processos. Os processos que você possui provavelmente se cruzarão com os processos de outras equipes, portanto, esforce-se para alinhar os padrões em uma extensão praticável.

    Documente onde os processos da equipe de carga de trabalho e de outras equipes divergem para garantir que a equipe de carga de trabalho possa trabalhar melhor com outras equipes quando houver pontos de interseção. As equipes de segurança central podem usar ferramentas e procedimentos diferentes da equipe de carga de trabalho, e as equipes podem colaborar mais facilmente se estiverem cientes dessas diferenças.

  • Incorpore os requisitos de conformidade em seus procedimentos operacionais padrão. Dependendo do seu setor e das regiões em que você opera, pode haver requisitos rigorosos sobre como executar e documentar tarefas. Certifique-se de entender e incorporar esses requisitos enquanto cria seus padrões. Treine regularmente a equipe de carga de trabalho sobre esses requisitos.

Implementar automação

Use a automação para ajudar a obter consistência. Automatize tarefas repetitivas e propensas a erros humanos para aliviar a carga de gerenciamento de sua equipe. Procure oportunidades para automatizar processos, como gerar tíquetes de ITSM, por exemplo. Para obter mais informações, consulte as Recomendações para implementar automação.

Controlar o uso de código aberto

Seja intencional sobre sua abordagem à adoção de código aberto. Padronize as regras sobre quando o uso de ferramentas de código aberto é permitido e garanta que você esteja alinhado com os requisitos organizacionais e de conformidade. Você pode querer criar padrões sobre as contribuições dos membros da equipe de carga de trabalho para projetos de código aberto e decidir se deseja abrir seu código interno para outras equipes de desenvolvimento na organização.

Compensação: A codificação de procedimentos operacionais normalizados pode acarretar o risco de conduzir à estagnação ou à complacência. As normas devem ser seguidas, mas não devem ser rígidas ou estáticas. Esforce-se para encontrar um equilíbrio entre adesão rigorosa e tolerância à inovação para que seus processos possam evoluir com segurança ao longo do tempo.

Facilitação do Azure

Embora não existam produtos do Azure que facilitem diretamente a formalização de processos e procedimentos, a Microsoft publica muitas orientações sobre este tópico. Use estas orientações para entender as práticas comprovadas e recomendadas pelo setor e considerar como aplicá-las à sua carga de trabalho.

O Well-Architected Framework também fornece orientação detalhada sobre os processos e procedimentos que devem ser codificados para garantir que sua carga de trabalho e sua equipe de carga de trabalho sejam executadas de acordo com os padrões do setor.

Lista de verificação de Excelência Operacional

Consulte o conjunto completo de recomendações.