COVID-19-Fälle des Europäischen Zentrums für die Prävention und die Kontrolle von Krankheiten l (ECDC)
Hier finden Sie die aktuell verfügbaren öffentlichen Daten zur geografischen Verbreitung der COVID-19-Fälle weltweit, die vom Europäischen Zentrum für die Prävention und die Kontrolle von Krankheiten (European Centre for Disease Prevention and Control, ECDC) stammen. Jede Zeile bzw. jeder Eintrag enthält die Anzahl der neu gemeldeten Fälle pro Tag und Land oder Region.
Hinweis
Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.
Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.
Datasets
Geänderte Versionen des Datasets sind im CSV-, JSON-, JSONL- und Parquet-Format verfügbar. Sie werden täglich aktualisiert:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Allen geänderten Datasets wurden iso_country_region-Codes und Ladezeiten hinzugefügt. Außerdem wurden die Spaltennamen in Kleinbuchstaben umformatiert und mit Unterstrichen versehen.
Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Vorgängerversionen der geänderten Daten und Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Datenvolumen
Nach Stand des 28. Mai 2020 enthalten diese 19.876 Zeilen (CSV: 1,5 MB, JSON: 4,9 MB, JSONL: 4,9 MB, Parquet: 54,1 KB).
Datenquellen-
Die Rohdaten werden täglich aus der ECDC-CSV-Datei übernommen. Weitere Informationen zu diesem Dataset, einschließlich seiner Ursprünge, finden Sie auf der Seite derECDC-Datensammlungen.
Datenqualität
Das ECDC übernimmt keine Garantie für die Genauigkeit oder Aktualität der Daten. Lesen Sie den Haftungsausschluss.
Anerkennung der Lizenzbedingungen und Nutzungsrechte
Diese Daten wurden unter Einhaltung der hier einsehbaren ECDC-Urheberrechtrichtlinie veröffentlicht und dürfen nur in Übereinstimmung mit dieser verwendet werden. Wenn das Urheberrecht an einem Dokument bei einem Dritten liegt, müssen Sie die Erlaubnis zur Vervielfältigung beim Inhaber des Urheberrechts einholen.
Das ECDC muss immer als ursprüngliche Quelle dieser Daten angegeben werden. Diese Bestätigung muss in jeder Kopie dieser Materialien vorhanden sein.
Contact
Wenden Sie sich bei Fragen oder Feedback zu diesem Dataset oder anderen Datasets im Data Lake zu COVID-19 an askcovid19dl@microsoft.com.
Spalten
Name | Datentyp | Eindeutig | Beispielwerte | BESCHREIBUNG |
---|---|---|---|---|
cases | SMALLINT | 5,515 | 1 2 | Anzahl gemeldeter Fälle |
continent_exp | Zeichenfolge | 6 | Europa, Afrika | Name des Kontinents |
countries_and_territories | Zeichenfolge | 214 | Kanada, Belgien | Name des Landes oder Gebiets |
country_territory_code | Zeichenfolge | 213 | KOR, ISL | Aus drei Buchstaben bestehender Länder- oder Gebietscode |
date_rep | date | 350 | 2020-12-11 2020-11-22 | Datum der Meldung |
day | SMALLINT | 31 | 14 13 | Tag des Monats |
Todesfälle | SMALLINT | 1,049 | 1 2 | Anzahl gemeldeter Todesfälle |
geo_id | Zeichenfolge | 214 | CA SE | Geografischer Bezeichner |
iso_country | Zeichenfolge | 214 | SE US | Landes- oder Regionscode gemäß ISO 3166 |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Uploaddatum der Daten in Azure |
month | SMALLINT | 12 | 10 8 | Monatsnummer |
year | SMALLINT | 2 | 2020 2019 | Jahr |
Vorschau
date_rep | day | month | year | cases | Todesfälle | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Asien | 4/26/2021 00:06:22 Uhr | AF |
Datenzugriff
Azure Notebooks
Dieses Notebook dokumentiert die URLs und den Beispielcode für den Zugriff auf die Dataset-URLs des Europäischen Zentrums für die Prävention und die Kontrolle von Krankheiten (ECDC) zu COVID-19-Fällen verschiedener Dataset-Dateiformate, die in Azure Blob Storage gehostet werden: CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Laden Sie die Dataset-Datei mithilfe des integrierten Funktionsdownloads in Pandas anhand der HTTP-URL herunter. Pandas verfügt über Reader für verschiedene Dateiformate:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.
Azure Synapse
Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.
Beispiele
Sehen Sie sich Beispiele für die Verwendung dieses Datasets an:
- Analysieren von COVID-Daten mit einem serverlosen Endpunkt in Synapse SQL
- Lineare Regressionsanalyse für COVID-Daten mithilfe des SQL Endpunkts in Azure Synapse Analytics
Nächste Schritte
Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.