Prever o tempo de internação e o fluxo de pacientes

Fábrica de dados do Azure
Armazenamento do Azure Data Lake
Azure Machine Learning
Azure Synapse Analytics
Power BI

Essa solução do Azure ajuda os administradores de hospitais a usarem o poder do aprendizado de máquina para prever o tempo de internação das admissões no hospital, a fim de melhorar o planejamento da capacidade e a utilização de recursos. Um diretor de informações médicas pode usar um modelo preditivo para determinar quais instalações estão sobrecarregadas e quais recursos reforçar dentro dessas instalações. Um gerente de linha de cuidado pode usar um modelo para determinar se há recursos de equipe adequados para lidar com a liberação de um paciente.

Arquitetura

Diagrama da arquitetura de monitoramento remoto de pacientes usando dispositivos de saúde e serviços do Azure.

Baixe um Arquivo Visio dessa arquitetura.

Fluxo de dados

O fluxo de dados a seguir corresponde ao diagrama anterior:

  1. Os dados de integridade anônimos de registros eletrônicos de saúde (EHR) e registros médicos eletrônicos (EMR) são extraídos usando o Azure Data Factory com o tempo de execução apropriado (por exemplo: Azure, Self-hosted). „”Nesse cenário, presumimos que os dados anônimos estejam acessíveis para extração em lote usando um dos conectores do Azure Data Factory, como ODBC, Oracle, SQL. Outras fontes de dados, como dados FHIR, podem exigir a inclusão de um serviço de ingestão intermediário, como o Azure Functions.

  2. Os dados do Azure Data Factory fluem através do Data Factory para o Armazenamento do Azure Data Lake (geração 2). Nenhum dado é armazenado no Azure Data Factory durante esse processo, e falhas como conexões descartadas podem ser manipuladas/repetidas durante esta etapa.

  3. O Azure Machine Learning é usado para aplicar algoritmos/pipelines de machine learning aos dados ingeridos na etapa 2. Os algoritmos podem ser aplicados com base em eventos, agendados ou manualmente, dependendo dos requisitos. Especificamente, isso inclui:

    3.1 Treinamento - Os dados ingeridos são usados para treinar um modelo de aprendizado de máquina usando uma combinação de algoritmos como regressão linear e árvore de decisão impulsionada por gradiente. Esses algoritmos são fornecidos por meio de várias estruturas (por exemplo, scikit-learn) normalmente em um pipeline e podem incluir etapas de pipeline de pré/pós-processamento. Como exemplo, fatores de saúde do paciente, como o tipo de admissão proveniente dos dados EMR/EHR pré-processados (por exemplo, linhas nulas) existentes, poderiam ser usados para treinar um modelo de regressão como a Regressão Linear. O modelo seria, então, capaz de predizer um novo tempo de internação do paciente.

    3.2 Validar - O desempenho do modelo é comparado aos modelos/dados de teste existentes e também em relação a quaisquer destinos de consumo downstream, como APIs (Application Programming Interfaces).

    3.3 Implantar - O modelo é empacotado usando um contêiner para uso em diferentes ambientes de destino.

    3.4 Monitor - As previsões do modelo são coletadas e monitoradas para garantir que o desempenho não se degrade com o tempo. Alertas podem ser enviados para acionar reciclagem/atualizações manuais ou automatizadas para o modelo, conforme necessário, usando esses dados de monitoramento. Observe que serviços adicionais, como o Azure Monitor, podem ser necessários, dependendo do tipo de dados de monitoramento extraídos.

  4. Fluxos de saída do Azure Machine Learning para o Azure Synapse Analytics. A saída do modelo (tempo previsto de permanência do paciente) é combinada com os dados existentes do paciente em uma camada escalável e de serviço, como pool SQL dedicado, para consumo downstream. Análises adicionais, como o tempo médio de permanência por hospital, podem ser feitas por meio do Synapse Analytics neste momento.

  5. O Azure Synapse Analytics fornece dados ao Power BI. Especificamente, o Power BI se conecta à camada de serviço na etapa (4) para extrair os dados e aplicar a modelagem semântica adicional necessária.

  6. O Power BI é usado para análise pelo gerente da linha de cuidado e pelo coordenador de recursos do hospital.

Componentes

  • O Azure Data Factory (ADF) fornece integração de dados totalmente gerenciada e sem servidor e serviço de orquestração capaz de integrar visualmente fontes de dados com mais de 90+ conectores internos e livres de manutenção sem custo adicional. Nesse cenário, o ADF é usado para ingerir dados e orquestrar os fluxos de dados.

  • O Azure Data Lake (ADLS) fornece um data lake seguro e escalável para análises de alto desempenho. Nesse cenário, o ADLS é usado como uma camada de armazenamento de dados escalável e econômica.

  • Os serviços do Azure Machine Learning (AML) aceleram o ciclo de vida de machine learning de previsão de LOS de ponta a ponta:

    • Capacitando os desenvolvedores e cientistas de dados com uma ampla gama de experiências produtivas para criar, treinar e implantar modelos de machine learning e promover a colaboração da equipe.
    • Acelerando o tempo de disponibilização no mercado com MLOps líderes do setor: operações de machine learning ou DevOps para machine learning.
    • Inovando em uma plataforma segura e confiável, projetada para um machine learning responsável.

    Nesse cenário, a LMA é o serviço usado para produzir o modelo usado para prever o tempo de permanência do paciente e gerenciar o ciclo de vida do modelo de ponta a ponta.

  • Azure Synapse Analytics: um serviço de análise ilimitado que reúne integração de dados, data warehouse empresarial e análise de Big Data. Nesse cenário, o Synapse é usado para incorporar as previsões do modelo no modelo de dados existente e também para fornecer uma camada de serviço de alta velocidade para consumo downstream.

  • Power BI: fornece análise self-service em escala empresarial, permitindo:

    • Criar uma cultura controlada por dados com business intelligence para todos.
    • Manter seus dados seguros com os recursos de segurança de dados líderes do setor, incluindo rotulagem de confidencialidade, criptografia de ponta a ponta e monitoramento de acesso em tempo real.

    Nesse cenário, o Power BI é usado para criar painéis de usuário final e aplicar qualquer modelagem semântica necessária nesses painéis.

Alternativas

  • Os serviços do Spark, como o Azure Synapse Analytics Spark e o Azure Databricks , podem ser usados como uma alternativa para executar o aprendizado de máquina, dependendo da escala de dados e do conjunto de habilidades da equipe de ciência de dados.
  • O MLFlow pode ser usado para gerenciar o ciclo de vida de ponta a ponta como uma alternativa ao Aprendizado de Máquina do Azure, dependendo do conjunto de habilidades/ambiente do cliente.
  • Os pipelines do Azure Synapse Analytics podem ser usados como uma alternativa ao Azure Data Factory na maioria dos casos, dependendo em grande parte do ambiente específico do cliente.

Detalhes do cenário

Para as pessoas que administram uma instalação de saúde, o tempo de internação (LOS) — o número de dias da admissão até a alta do paciente — é importante. No entanto, esse número pode variar dependendo do estabelecimento e das condições e particularidades da doença, mesmo dentro do mesmo sistema de saúde, tornando difícil acompanhar o fluxo de pacientes e o plano deles corretamente.

Esta solução habilita um modelo de previsão do tempo de permanência para internações hospitalares. O LOS (tempo de permanência) é definido em número de dias a partir da data inicial da internação até a data em que o paciente recebe alta de qualquer instituição hospitalar específica. Pode haver variações significativas da LOS de acordo com as diversas instalações e entre especialidades e condições médicas, até no mesmo sistema de serviço de saúde.

Estudos como O tempo de internação do paciente está relacionado à qualidade do cuidado? , mostraram que um tempo de permanência ajustado ao risco mais longo está correlacionado com menor qualidade do cuidado recebido. A previsão avançada do tempo de permanência hospitalar no momento da admissão pode melhorar a qualidade do atendimento ao paciente, fornecendo aos provedores um tempo de permanência esperado que eles podem usar como uma métrica para comparar com o tempo de permanência atual do paciente. Isso pode ajudar a garantir que os pacientes com tempo de permanência hospitalar maior do que o esperado recebam atenção adequada. A previsão do LOS também ajuda no planejamento preciso das altas, resultando na redução de várias outras medidas de qualidade, como as readmissões.

Possíveis casos de uso

Há dois usuários empresariais diferentes no gerenciamento de hospitais que podem se beneficiar de previsões mais confiáveis sobre o tempo da permanência, bem como as famílias dos pacientes:

  • O diretor de informações médicas (CMIO), que permeia a divisão entre informática/tecnologia e os profissionais de saúde em uma organização de serviços de saúde. Suas tarefas geralmente incluem o uso de análises para determinar se os recursos estão sendo alocado adequadamente em uma rede de hospitais. Como parte disso, o CMIO precisa ser capaz de determinar quais instalações estão sendo sobrecarregadas e, especificamente, quais recursos dessas instalações devem ser reforçados para realinhar os recursos com as necessidades.
  • O gerente da linha de cuidado, que está diretamente envolvido no cuidado dos pacientes. Essa função exige o monitoramento do status de cada paciente, bem como a certeza de que a equipe está disponível para atender às demandas de cuidados de seus pacientes. O gerente da linha de atendimento pode tomar decisões médicas precisas e alinhar os recursos certos com bastante antecedência. Por exemplo, a capacidade de prever LOS:
    • como uma avaliação inicial do risco dos pacientes é fundamental para um melhor planejamento e alocação de recursos, especialmente quando os recursos são limitados, como nas UTIs.
    • permite que os gerentes da linha de atendimento determinem se os recursos da equipe serão adequados para lidar com a liberação de um paciente.
  • A previsão do tempo de permanência hospitalar na UTI também é benéfica para os pacientes e seus familiares, bem como para as companhias de seguros. Uma data prevista para a alta hospitalar ajuda os pacientes e suas famílias a entender e estimar os custos médicos. Isso também dá às famílias uma ideia sobre a velocidade de recuperação de um paciente e as ajuda a planejar a alta e gerenciar seus orçamentos.

Considerações

Estas considerações implementam os pilares do Azure Well-Architected Framework, que é um conjunto de princípios de orientação que podem ser usados para aprimorar a qualidade de uma carga de trabalho. Para obter mais informações, consulte Microsoft Azure Well-Architected Framework.

Otimização de custo

A otimização de custos é a análise de maneiras de reduzir as despesas desnecessárias e melhorar a eficiência operacional. Para obter mais informações, confira Visão geral do pilar de otimização de custo.

O componente mais caro dessa solução é a computação e há várias maneiras de dimensionar a computação de forma econômica com o volume de dados. Um exemplo seria usar um serviço do Spark como o Azure Synapse Analytics Spark ou o Azure Databricks para o trabalho de engenharia de dados, em vez de uma solução de nó único. O Spark é dimensionado horizontalmente e é mais econômico em comparação com soluções de nó único grandes e dimensionadas verticalmente.

O preço de todos os componentes do Azure configurados nesta arquitetura pode ser encontrado nesta estimativa salva da Calculadora de Preços do Azure. Essa estimativa é configurada para mostrar os custos iniciais e mensais estimados, para uma implementação básica que funciona das 9h às 17h de segunda a sexta-feira.

Excelência operacional

A excelência operacional abrange os processos de operações que implantam um aplicativo e o mantêm em execução na produção. Para obter mais informações, confira Visão geral do pilar de excelência operacional.

Uma sólida prática e implementação de operações de Machine Learning (MLOps) desempenha um papel crítico na produção desse tipo de solução. Para obter mais informações, consulte Operações de aprendizado de máquina (MLOps).

Eficiência de desempenho

A eficiência do desempenho é a capacidade de dimensionar sua carga de trabalho para atender às demandas colocadas por usuários de maneira eficiente. Para obter mais informações, consulte Visão geral do pilar de eficiência de desempenho.

Nesse cenário, o pré-processamento de dados é executado no Aprendizado de Máquina do Azure. Embora esse design funcione para volumes de dados pequenos a médios, grandes volumes de dados ou cenários com SLAs quase em tempo real podem ter dificuldades do ponto de vista do desempenho. Uma maneira de resolver esse tipo de preocupação é usar um serviço do Spark como o Azure Synapse Analytics Spark ou o Azure Databricks para cargas de trabalho de engenharia de dados ou ciência de dados. O Spark é dimensionado horizontalmente e distribuído por design, permitindo que ele processe grandes conjuntos de dados de forma muito eficaz.

Segurança

A segurança fornece garantias contra ataques deliberados e o abuso de seus dados e sistemas valiosos. Para saber mais, confira Visão geral do pilar de segurança.

Importante

Essa arquitetura funcionará com dados de saúde anônimos e não anonimizados. No entanto, para uma implementação segura, recomendamos que os dados de saúde sejam obtidos de forma anônima de fontes EHR e EMR.

Para obter mais informações sobre recursos de segurança e governança disponíveis para o Aprendizado de Máquina do Azure, consulte Segurança corporativa e governança para o Aprendizado de Máquina do Azure

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Principais autores:

  • Dhanshri Mais | Arquiteto Principal de Soluções em Nuvem
  • DJ Dean | Arquiteto principal de soluções de nuvem

Para ver perfis não públicos do LinkedIn, entre no LinkedIn.

Próximas etapas

Tecnologias e recursos relevantes para implementar essa arquitetura:

Veja conteúdo adicional do Centro de Arquitetura do Azure relacionado a essa arquitetura: