Casi di COVID-19 del Centro europeo per la prevenzione e il controllo delle malattie (ECDC)

I dati pubblici più recenti disponibili sulla distribuzione geografica dei casi di COVID-19 in tutto il mondo dal Centro europeo per la prevenzione e il controllo delle malattie (ECDC). Ogni riga/voce contiene il numero di nuovi casi segnalati al giorno e in ogni paese o area.

Nota

Microsoft fornisce i set di dati aperti di Azure così come sono e non fornisce né garanzie, esplicite o implicite, né specifica alcuna condizione in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft declina tutte le responsabilità per eventuali danni o perdite, incluse dirette, consequenziali, speciali, indirette, accidentali o irreversibili, risultanti dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Set di dati

Versioni modificate del set di dati sono disponibili in formato CSV, JSON, JSON-Lines e Parquet e vengono aggiornate ogni giorno:

A tutte le versioni modificate sono stati aggiunti codici iso_country_region e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.

Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume dei dati

In data 28 maggio 2020 contenevano 19.876 righe (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Origine dati

I dati non elaborati vengono inseriti ogni giorno dal file ECDC csv. Per altre informazioni su questo set di dati, incluse le origini, vedere la pagina di raccolta dati del ECDC.

Qualità dei dati

ECDC non garantisce l'accuratezza o la tempestività dei dati. Leggere la clausola di responsabilità.

Attribuzione dei diritti di licenza e utilizzo

Questi dati vengono resi disponibili e ne è consentito l'uso in base ai criteri per il copyright di ECDC, disponibili qui. Per eventuali documenti con copyright di terze parti, è necessario ottenere l'autorizzazione per la riproduzione dal proprietario del copyright.

È necessario indicare sempre ECDC come fonte originale dei dati. Tale riconoscimento deve essere incluso in ogni copia del materiale.

Contatto

Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.

Colonne

Nome Tipo di dati Unica Valori (esempio) Descrizione
cases smallint 5,515 1 2 Numero di casi segnalati
continent_exp string 6 Europa Africa Nome del continente
countries_and_territories string 214 Canada Belgio Nome del paese o del territorio
country_territory_code string 213 KOR ISL Codice di tre lettere per il paese o il territorio
date_rep data 350 11-12-2020 22-11-2020 Data del report
Giorno smallint 31 14 13 Giorno del mese
morti smallint 1.049 1 2 Numero di decessi segnalati
geo_id string 214 CA SE Identificatore geografico
iso_country string 214 SE US Codice ISO 3166 del paese o dell'area geografica
load_date timestamp 1 26-04-2021 00:06:22.123000 Data del caricamento dei dati in Azure
mese smallint 12 10 Numero del mese
year smallint 2 2020 2019 Anno

Anteprima

date_rep Giorno mese year cases morti countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
14-12-2020 14 12 2020 746 6 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
13-12-2020 13 12 2020 298 9 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
12-12-2020 12 12 2020 113 11 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
11-12-2020 11 12 2020 63 10 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
10-12-2020 10 12 2020 202 16 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
09-12-2020 9 12 2020 135 13 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
08-12-2020 8 12 2020 200 6 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
06-12-2020 6 12 2020 234 10 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF
05-12-2020 5 12 2020 235 18 Afghanistan AF AFG Asia 26/04/2021 12:06:22 AF

Accesso ai dati

Azure Notebooks

Questo notebook documenta gli URL e il codice di esempio per accedere all’URL del set di dati relativi ai casi di Covid-19 del Centro europeo per la prevenzione e il controllo delle malattie (ECDC) di diversi formati di file di dati ospitati sull’Archiviazione BLOB di Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Scaricare il file del set di dati usando il download delle funzionalità predefinite da un URL HTTP in Pandas. Pandas include lettori per diversi formati di file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Campione non disponibile per questa combinazione di piattaforma/pacchetto.

Azure Synapse

Campione non disponibile per questa combinazione di piattaforma/pacchetto.

Esempi

Vedere esempi di come usare questo set di dati:

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.