Panoramica della strategia per il patrimonio dei dati

Articolo
12/25/2023

L'integrazione dei dati sanitari e delle scienze biologiche provenienti da vari sistemi e applicazioni è stata un'impresa costosa e dispendiosa in termini di tempo. Per affrontare questi problemi, l’implementazione di una strategia per il patrimonio dei dati diventa cruciale, poiché stabilisce standard uniformi affinché le organizzazioni possano gestire in modo efficiente tutti i propri dati, indipendentemente dalla posizione o dal formato di archiviazione.

La strategia per il patrimonio dei dati si riferisce a un approccio completo e strutturato adottato dalle organizzazioni per gestire in modo efficace l’intero ecosistema di dati. La strategia prevede lo sviluppo di un piano ben definito e di una serie di linee guida per l'acquisizione, l'archiviazione, l'elaborazione, la protezione e l'utilizzo dei dati attraverso varie fonti, sistemi e applicazioni nell'organizzazione. Poiché gli istituti sanitari e di scienze biologiche gestiscono una vasta gamma di dati, inclusi dati clinici, di imaging, operativi e di ricerca, una gestione efficace dei dati diventa cruciale per mantenere la riservatezza, la conformità normativa e ottenere un vantaggio competitivo, oltre a fornire cure efficaci ai pazienti.

Nota

Microsoft Fabric è una soluzione di analisi all-in-one per le aziende che copre tutto, dallo spostamento dati alla data science, all'analisi in tempo reale e alla business intelligence. Offre una suite completa di servizi, tra cui data lake, ingegneria dei dati e integrazione dei dati, tutto in un'unica posizione. Le soluzioni di dati sanitari in Microsoft Fabric consentono alle organizzazioni sanitarie di abbattere i silos di dati e armonizzare i loro diversi dati sanitari in un unico archivio unificato in cui i carichi di lavoro di analisi e intelligenza artificiale possono operare su larga scala. Sfruttando le funzionalità native della piattaforma, le organizzazioni sanitarie possono creare esperienze connesse in ogni punto di assistenza, potenziare la propria forza lavoro e ottenere valore dai dati clinici e operativi. Soluzioni per i dati sanitari in Microsoft Fabric sono attualmente in anteprima e questa documentazione "Well-Architected" verrà aggiornata in una versione futura per includere soluzioni di dati sanitari in Microsoft Fabric.

La gestione dei dati in ambito sanitario e delle scienze biologiche

Man mano che il settore sanitario passa a un modello di assistenza basato sul valore con un’enfasi sull’assistenza incentrata sul paziente, il volume dei dati dei pazienti generati attraverso esperienze immersive è cresciuto in modo significativo. La crescita esponenziale dei dati sanitari in vari punti di contatto richiede una solida strategia di gestione dei dati per gestire e utilizzare in modo efficace questi dati per generare informazioni utili in grado di migliorare la salute generale di membri e pazienti.

Sfide di gestione dei dati

I settori della sanità e delle scienze biologiche sono ambienti complessi e dinamici che richiedono un elevato grado di integrazione e interoperabilità per funzionare in modo efficace. Una delle sfide principali di questo settore è che è tradizionalmente in silos, con diversi fornitori e organizzazioni che utilizzano sistemi e tecnologie diversi. L’assenza di integrazione e interoperabilità tra questi sistemi e tecnologie ha portato a inefficienze, errori e mancanza di continuità nella cura dei pazienti. Di seguito sono elencate alcune sfide comuni relative alla gestione dei dati:

Silos di dati: la mancanza di condivisione dei dati tra diversi sistemi porta a silos di dati. Gli operatori sanitari hanno difficoltà ad accedere e condividere i dati dei pazienti, il che può portare a una mancanza di continuità delle cure.
Mancanza di standardizzazione: le organizzazioni sanitarie e le aziende del settore delle scienze della vita utilizzano sistemi e tecnologie diversi, rendendo difficile la comunicazione e lo scambio di dati senza soluzione di continuità.
Complessità dei sistemi: i sistemi sanitari e delle scienze biologiche sono sempre più complessi e rappresentano una sfida per integrare e far interagire i dati in modo efficace, il che porta a maggiori costi e ritardi nella fornitura delle cure.
Dati non corretti o mancanti: dati non corretti o mancanti compromettono l'accuratezza e l'affidabilità degli approfondimenti derivati da questi dati.
Problemi di sicurezza e privacy: la sicurezza e la privacy dei dati dei pazienti sono fondamentali per gli operatori sanitari e le aziende del settore delle scienze biologiche. La condivisione dei dati tra sistemi diversi può aumentare il rischio di violazioni dei dati e compromettere la privacy dei pazienti.
Normative di settore: i settori sanitari e delle scienze biologiche hanno le normative di settore più rigorose sulla gestione dei dati, il che rende difficile la condivisione e l'accesso ai dati.
Deidentificazione dei dati non uniformi: la deidentificazione dei dati è spesso richiesta dalla legge, il che è difficile e richiede tempo.
Set di dati geograficamente unici: è difficile trasformare set di dati geograficamente unici per la ricerca (ad esempio, dati sulla salute della popolazione).

Fasi di gestione dei dati

Esistono varie fasi coinvolte nella gestione efficace di dati di grandi dimensioni e ciascuna fase è ugualmente importante per generare informazioni utili di alta qualità utilizzando i dati sottostanti.

Le fasi principali sono:

Individuazione

L'individuazione dei dati nel contesto dell'assistenza sanitaria e delle scienze biologiche si riferisce al processo di identificazione delle fonti dei dati, del formato dei dati come dati strutturati e non strutturati e dell'accesso ad essi. I dati del mondo reale e l'evidenza del mondo reale sono alcuni modi per individuare i dati. I dati del mondo reale si riferiscono ai dati che vengono regolarmente raccolti da varie fonti al di fuori degli studi clinici tradizionali, come cartelle cliniche elettroniche, richieste di indennizzi e attività di fatturazione, dati di prescrizione, dati da dispositivi indossabili e dati raccolti tramite sondaggi sui pazienti o altri metodi generati dai pazienti. L'immagine seguente illustra i dati sanitari più comuni in base alla tassonomia e agli standard dei dati.

Inserimento

L'inserimento è il processo di connessione, raccolta e controllo del flusso di informazioni provenienti da varie fonti identificate nella fase di individuazione. Le immagini seguenti illustrano le diverse opzioni come Funzioni di Azure, App per la logica, Azure Data Factory e così via. Fornito da Microsoft per acquisire vari tipi di informazioni.

L'immagine seguente mostra una pipeline di acquisizione per inserire dati IoT da dispositivi medici come dispositivi indossabili intelligenti.

L'immagine seguente illustra l'idea che i dati generati dal dispositivo medico potrebbero non essere in formato standard, pertanto vengono prima normalizzati e quindi archiviati in un server FHIR come risorsa di osservazione FHIR. I passaggi illustrati nel diagramma vengono eseguiti automaticamente dal servizio MedTech in Azure Health Data Services.

L'immagine seguente illustra la pipeline di acquisizione per utilizzare dati clinici, dati DICOM, dati non strutturati e SDoH.

Persistenza

È molto importante archiviare i dati acquisiti in un archivio permanente. Ciò consente ad altre applicazioni, come la pipeline di apprendimento automatico, di utilizzare e generare informazioni dettagliate sui dati, nonché Power BI di visualizzare la distribuzione dei dati. Microsoft fornisce varie piattaforme di persistenza, come Azure Data Lake Storage, Azure Health Data Services e Microsoft Dataverse, per archiviare i dati sanitari. Microsoft fornisce anche API come API del servizio FHIR, servizio DICOM, servizio MedTech, API sanitarie Dataverse per importare i dati nella piattaforma fornita.

Integrazione

L’integrazione si riferisce al processo di riunione di diversi sistemi, tecnologie, fonti di dati e processi per creare un’esperienza coesa per pazienti, operatori sanitari e altre parti interessate. Microsoft Cloud for Healthcare offre strumenti pronti all'uso per integrare il repository di dati Dataverse con varie origini dati sanitari come Azure Health Data Services, server FHIR non Microsoft e così via. L'immagine seguente illustra l'integrazione dei dati FHIR in Azure Databricks Delta Lake in Servizi per i dati sanitari di Azure. Per ulteriori informazioni, fai riferimento a Connessione di dati FHIR ad Azure Databricks Delta Lake in Servizi per i dati sanitari di Azure

Intelligence

L'intelligence si riferisce al processo di aggiunta di intelligence ai nostri dati per ottenere informazioni più approfondite. Microsoft fornisce strumenti come Azure Machine Learning, servizi cognitivi, Azure Databricks, Azure Synapse Analytics, ecc. per aggiungere intelligence ai dati sanitari.

Analisi

L’analisi implica l’analisi dei dati sanitari per scoprire tendenze e modelli. Strumenti come Power BI possono essere utilizzati per visualizzare tendenze e modelli nei dati sanitari per migliorare il supporto alle decisioni cliniche e anche per migliorare l'efficacia operativa.

L'immagine sotto mostra il ciclo di vita completo dei dati sanitari:

L'immagine sotto illustra il ciclo di vita completo dei dati MedTech:

Soluzioni di gestione dei dati offerte da Microsoft

Microsoft offre un'ampia gamma di strumenti per gestire i dati sanitari. La tabella seguente fornisce un elenco completo di strumenti che possono essere utilizzati per gestire i dati sanitari. È possibile seguire il collegamento di riferimento corrispondente a ciascuno strumento per ulteriori informazioni.

Fase dei dati	Strumenti	Descrizione	Benefit	Collegamento di riferimento
Inserimento	Caricatore di dati FHIR in blocco ed esportazione	Una soluzione app per le funzioni di Azure che fornisce l'acquisizione e l'esportazione di servizi dati FHIR.	Il caricatore di dati FHIR in blocco può importare centinaia di migliaia di file all'ora.	microsoft/fhir-loader: Caricatore di dati FHIR in blocco
Inserimento	Convertitore FHIR	Abilita la conversione di dati sanitari da standard legacy a FHIR	Supporta la seguente conversione: 1. Da HL7v2 a FHIR 2. Da C-CDA a FHIR 3. Dal JSON a FHIR 4. Da FHIR STU3 a FHIR R4	microsoft/FHIR-Converter: utilità di conversione per convertire formati di dati legacy in FHIR
Inserimento	Healthkit-on-FHIR	HealthKitOnFhir è una libreria Swift che automatizza l'esportazione di dati Apple HealthKit a un server FHIR®.	I dati HealthKit possono essere instradati attraverso il Connettore FHIR IoMT per Azure per raggruppare dati ad alta frequenza allo scopo di ridurre il numero di risorse di osservazione generate. I dati HealthKit possono anche essere esportati direttamente in un server FHIR (appropriato per dati a bassa frequenza).	microsoft/healthkit-on-fhir: HealthKitOnFhir è una libreria Swift che automatizza l'esportazione di dati Apple HealthKit a un server FHIR®
Persistenza	Modello di dati Microsoft Cloud for Healthcare	I modelli di dati in Microsoft Cloud for Healthcare si basano sul framework degli standard Fast Healthcare Interoperability Resources (FHIR), facilmente distribuibili in un ambiente Dataverse.	Facilita l'implementazione di nuovi casi d'uso e flussi di lavoro senza ridefinire l'architettura dei dati sanitari. I modelli basati su FHIR rendono le implementazioni di Dynamics 365 per i clienti del settore sanitario più semplici, rapide e sicure.	Panoramica del modello di dati
Persistenza	Dataverse Healthcare API	Supporta la scrittura di dati FHIR a entità Dataverse e legge i dati da entità Dataverse in formato FHIR.	La trasformazione dei dati FHIR in un modello di dati comune e viceversa viene gestita automaticamente da	Panoramica di Dataverse Healthcare API
Persistenza	Servizi per i dati sanitari di Azure	Si tratta di un servizio piattaforma distribuita come servizio (PaaS) che fornisce una piattaforma unificata per archiviare dati FHIR, DICOM e MedTech.	Consente percorsi più sicuri e conformi per acquisire, rendere persistenti e connettere i dati sanitari nel cloud.	Introduzione a Servizi per i dati sanitari di Azure
Integrazione	Data Integration Toolkit	Fornisce una vasta raccolta di mapping di entità e di attributi predefiniti creati per conformarsi alla specifica FHIR HL7 e che vengono distribuiti come record Dataverse.	È altamente configurabile per soddisfare vari requisiti di soluzione.	Panoramica di Data Integration Toolkit - Microsoft Cloud for Healthcare
Integrazione	Tabelle di dati sanitari virtuali	Supporta il trasferimento dei dati direttamente dal server FHIR nella soluzione Microsoft Cloud for Healthcare senza archiviare in modo permanente i dati nelle entità Dataverse.	Evita la duplicazione dei dati e consente di risparmiare sui costi di archiviazione.	Panoramica delle tabelle di dati sulla salute virtuali
Intelligenza	Text Analytics for Health	Si tratta di una funzionalità predefinita offerta da Azure AI Language. Si tratta di un servizio API basato su cloud che applica l'intelligenza dell'apprendimento automatico per estrarre ed etichettare informazioni mediche pertinenti da una varietà di testi non strutturati come note mediche, riepiloghi di dimissione, documenti clinici e cartelle cliniche elettroniche.	Text Analytics for Health esegue quattro funzioni chiave, ovvero riconoscimento di entità denominate, estrazione di relazioni, collegamento delle entità e rilevamento di asserzioni, il tutto con una singola chiamata API.	Cos'è Text Analytics for Health in Azure AI Language? - Servizi di Azure per intelligenza artificiale
Persistenza e analisi	Modelli di database di assistenza sanitaria	I modelli di database presenti in Azure Synapse sono definizioni di schema specifiche del settore che forniscono un metodo rapido per creare un database, noto come lake database, che può accelerare la creazione di applicazioni del settore basate su analisi.	È possibile utilizzare questi progetti di informazioni per pianificare, strutturare e progettare soluzioni di dati per la governance dei dati, reporting, la business intelligence e l'analisi avanzata.	Utilizzare modelli di database sanitari con Microsoft Cloud for Healthcare
Analisi	Analisi del servizio FHIR con analisi di Azure Databricks Delta Lake Analytics	Data Lakehouse è un'architettura dati aperta che combina le funzionalità esistenti dei tradizionali data lake e data warehouse. Delta Lake è emerso come il framework di archiviazione leader che consente di creare un'architettura lakehouse basata su tecnologie data lake esistenti. Servizi per i dati sanitari di Azure abilita le architetture Lakehouse esportando file parquet di dati FHIR che si allineano allo standard aperto SQL su FHIR.	Creare una Lakehouse per i dati FHIR presenta questi vantaggi: 1. Combinazione dei tuoi dati FHIR con altri set di dati. 2. Avere una posizione coerente di dati pronti per l'azienda consente un maggiore self-service in tutta l'organizzazione. 3. Gestione dei metadati e controllo delle versioni dei dati semplificando i dati che vengono spesso aggiornati.	healthcare-apis-samples/src/azuredatabricks-deltalake nella pagina principale · microsoft/healthcare-apis-samples
Test in corso	Synthea	Synthea è un generatore di pazienti sintetici che modella l'anamnesi dei pazienti sintetici. Fornisce dati pazienti sintetici, realistici ma non reali, di alta qualità e cartelle cliniche associate che coprono ogni aspetto dell'assistenza sanitaria.	I dati risultanti sono esenti da restrizioni in termini di costi, privacy e sicurezza. Possono essere utilizzati senza restrizioni per una varietà di usi secondari nel mondo accademico, nella ricerca, nell'industria e nel governo.	synthetichealth/Wiki di synthea

Vedi anche

Esistono alcune architetture comunemente utilizzate per lavorare con i dati sanitari nella piattaforma Microsoft Cloud for Healthcare. Questi possono essere utilizzati come riferimento per personalizzare le soluzioni esatte necessarie per gestire e gestire i dati sanitari. Per ulteriori informazioni, vedi Architetture di riferimento di Microsoft Cloud for Healthcare.

Ulteriori informazioni su Microsoft Fabric con uno scenario end-to-end:

Scenario end-to-end di Microsoft Fabric Lakehouse

Condividi tramite