Bing Daten zu COVID-19

Diese Bing-Daten zu COVID-19 enthalten bestätigte Fälle, Fälle mit tödlichem Verlauf und genesene Patienten aus allen Regionen. Sie werden täglich aktualisiert. Der Bing COVID-19 Tracker gibt diese Daten wieder.

Bing sammelt Daten aus mehreren vertrauenswürdigen und zuverlässigen Quellen, einschließlich:

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datasets

Die geänderten Bing-Datasets zu COVID-19 sind im CSV-, JSON-, JSON-Lines und Parquet-Format verfügbar:

Alle geänderten Datasets wurden mit ISO-3166-Unterteilungscodes und Ladezeiten versehen. Sie verwenden Spaltennamen in Kleinbuchstaben mit Trennzeichen in Form von Unterstrichen.

Rohdaten im CSV-Format

Frühere Versionen von geänderten und Rohdaten sind in dieser Ressource verfügbar.

Datenmenge

Alle Datasets erhalten tägliche Updates. Seit dem 5. März 2023 enthalten sie 4.766.737 Zeilen. Das Dataset ist in den folgenden Dateiformaten verfügbar:

  • CSV (560,3 MB)
  • JSON (1515,6 MB)
  • JSONL (1506,2 MB)
  • Parquet (55,4 MB)

Anerkennung der Lizenzbedingungen und Nutzungsrechte

Die Daten sind ausschließlich für akademische und Bildungszwecke unter diesen Geschäftsbedingungen verfügbar. Zu den erlaubten Zwecken gehören:

  • Akademische Einrichtungen
  • Behörden
  • Medizinische Forschung

In Publikationen verwendete oder zitierte Daten müssen mit einem Zuordnungsverweis zum Bing COVID-19 Tracker und einem Link zu www.bing.com/covid gekennzeichnet werden.

Contact

Wenn Sie Fragen oder Feedback zu diesem oder anderen Datasets im COVID-19-Data Lake haben, wenden Sie sich an askcovid19dl@microsoft.com.

Spalten

Name Datentyp Eindeutig Beispielwerte BESCHREIBUNG
admin_region_1 Zeichenfolge 864 Texas Georgia Region in country_region
admin_region_2 Zeichenfolge 3.143 Washington County Jefferson County Region in admin_region_1
bestätigt INT 120,692 1 2 Bestätigte Todesfälle in der Region
confirmed_change INT 12,120 1 2 Änderungen an der Anzahl der bestätigten Fälle im Vergleich zum Vortag
country_region Zeichenfolge 237 Vereinigte Staaten – Indien Land/Region
Todesfälle INT 20,616 1 2 Anzahl der Todesfälle in der Region
deaths_change SMALLINT 1,981 1 2 Änderungen an der Anzahl der Todesfälle im Vergleich zum Vortag
id INT 1,783,534 742546 69019298 Eindeutiger Bezeichner
iso_subdivision Zeichenfolge 484 US-TX US-GA Zweiteiliger ISO-Teilgebietscode
iso2 Zeichenfolge 226 US IN Ländercode (zwei Buchstaben)
iso3 Zeichenfolge 226 USA IND Ländercode (drei Buchstaben)
latitude double 5,675 42.28708 19.59852 Breitengrad des Schwerpunkts der Region
load_time timestamp 1 2021-04-26 00:06:34.719000 Datum und Uhrzeit des Dateiuploads von der Bing-Quelle auf GitHub
longitude double 5,693 -2.5396 -155.5186 Längengrad des Schwerpunkts der Region
genesen INT 73,287 1 2 Anzahl genesener Patienten in der Region
recovered_change INT 10,441 1 2 Änderungen an der Anzahl genesener Patienten im Vergleich zum Vortag
aktualisiert date 457 2021-04-23 2021-04-22 Datumsangabe für aktuellen Stand des Datensatzes

Vorschau

id aktualisiert bestätigt Todesfälle iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr
338996 2020-01-22 313 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 51 0
338997 23.01.2020 578 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 265 0
338998 2020-01-24 841 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 263 0
338999 2020-01-25 1320 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 479 0
339000 2020-01-26 2014 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 694 0
339001 2020-01-27 2798 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 784 0
339002 2020-01-28 4593 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1795 0
339003 2020-01-29 6065 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1472 0
339004 30.01.2020 7818 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1753 0

Datenzugriff - Azure Notebooks

Hinweis

In diesem Notebook werden die URLs und der Beispielcode für den Zugriff auf das Bing COVID-19-Dataset dokumentiert.

Verwenden Sie die diese URLs, um bestimmte Dateiformate zu erhalten, die auf Azure Blob Storage gehostet sind:

Laden Sie die Dataset-Datei mithilfe des integrierten Pandas-Downloads mit der HTTP-URL herunter. Pandas verfügt über Reader für verschiedene Dateiformate:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Um zu überprüfen, ob die aktualisierte Spalte das datetime-Format aufweist, prüfen Sie die Datentypen der verschiedenen Felder:

df.dtypes

Überprüfen Sie die weltweiten Daten. Um die Daten zu visualisieren, erstellen Sie einige Diagramme:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Datenzugriff – Azure Databricks

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Datenzugriff – Azure Synapse

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.