Casi di COVID-19 del Centro europeo per la prevenzione e il controllo delle malattie (ECDC)
I dati pubblici più recenti disponibili sulla distribuzione geografica dei casi di COVID-19 in tutto il mondo dal Centro europeo per la prevenzione e il controllo delle malattie (ECDC). Ogni riga/voce contiene il numero di nuovi casi segnalati al giorno e in ogni paese o area.
Nota
Microsoft fornisce i set di dati aperti di Azure così come sono e non fornisce né garanzie, esplicite o implicite, né specifica alcuna condizione in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft declina tutte le responsabilità per eventuali danni o perdite, incluse dirette, consequenziali, speciali, indirette, accidentali o irreversibili, risultanti dall'uso dei set di dati.
Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.
Set di dati
Versioni modificate del set di dati sono disponibili in formato CSV, JSON, JSON-Lines e Parquet e vengono aggiornate ogni giorno:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
A tutte le versioni modificate sono stati aggiunti codici iso_country_region e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.
Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volume dei dati
In data 28 maggio 2020 contenevano 19.876 righe (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Origine dati
I dati non elaborati vengono inseriti ogni giorno dal file ECDC csv. Per altre informazioni su questo set di dati, incluse le origini, vedere la pagina di raccolta dati del ECDC.
Qualità dei dati
ECDC non garantisce l'accuratezza o la tempestività dei dati. Leggere la clausola di responsabilità.
Attribuzione dei diritti di licenza e utilizzo
Questi dati vengono resi disponibili e ne è consentito l'uso in base ai criteri per il copyright di ECDC, disponibili qui. Per eventuali documenti con copyright di terze parti, è necessario ottenere l'autorizzazione per la riproduzione dal proprietario del copyright.
È necessario indicare sempre ECDC come fonte originale dei dati. Tale riconoscimento deve essere incluso in ogni copia del materiale.
Contatto
Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.
Colonne
Nome | Tipo di dati | Unica | Valori (esempio) | Descrizione |
---|---|---|---|---|
cases | smallint | 5,515 | 1 2 | Numero di casi segnalati |
continent_exp | string | 6 | Europa Africa | Nome del continente |
countries_and_territories | string | 214 | Canada Belgio | Nome del paese o del territorio |
country_territory_code | string | 213 | KOR ISL | Codice di tre lettere per il paese o il territorio |
date_rep | data | 350 | 11-12-2020 22-11-2020 | Data del report |
Giorno | smallint | 31 | 14 13 | Giorno del mese |
morti | smallint | 1.049 | 1 2 | Numero di decessi segnalati |
geo_id | string | 214 | CA SE | Identificatore geografico |
iso_country | string | 214 | SE US | Codice ISO 3166 del paese o dell'area geografica |
load_date | timestamp | 1 | 26-04-2021 00:06:22.123000 | Data del caricamento dei dati in Azure |
mese | smallint | 12 | 10 | Numero del mese |
year | smallint | 2 | 2020 2019 | Anno |
Anteprima
date_rep | Giorno | mese | year | cases | morti | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
14-12-2020 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
13-12-2020 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
12-12-2020 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
11-12-2020 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
10-12-2020 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
09-12-2020 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
08-12-2020 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
06-12-2020 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
05-12-2020 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Asia | 26/04/2021 12:06:22 | AF |
Accesso ai dati
Azure Notebooks
Questo notebook documenta gli URL e il codice di esempio per accedere all’URL del set di dati relativi ai casi di Covid-19 del Centro europeo per la prevenzione e il controllo delle malattie (ECDC) di diversi formati di file di dati ospitati sull’Archiviazione BLOB di Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Campione non disponibile per questa combinazione di piattaforma/pacchetto.
Azure Synapse
Campione non disponibile per questa combinazione di piattaforma/pacchetto.
Esempi
Vedere esempi di come usare questo set di dati:
- Analizzare i dati relativi al COVID con l'endpoint serverless di Synapse SQL
- Analisi di regressione lineare sui dati relativi al COVID utilizzando l'endpoint SQL in Azure Synapse Analytics
Passaggi successivi
Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.