Bing COVID-19

Les données COVID-19 de Bing incluent les cas confirmés, décédés et guéris de toutes les régions, mis à jour quotidiennement. La page Bing COVID-19 Tracker reflète ces données.

Bing collecte des données à partir de plusieurs sources fiables et approuvées, notamment :

Remarque

Microsoft fournit Azure Open Datasets « en l’état ». Microsoft n’offre aucune garantie, expresse ou implicite, ni de conditions relatives à votre utilisation des jeux de données. Dans la mesure autorisée par votre droit local, Microsoft décline toute responsabilité pour les dommages ou pertes, y compris directs, consécutifs, spéciaux, indirects ou punitifs, résultant de votre utilisation des jeux de données.

Ce jeu de données est fourni selon les conditions initiales par lesquelles Microsoft a reçu les données sources. Le jeu de données peut inclure des données provenant de Microsoft.

Groupes de données

Les jeux de données modifiés Bing COVID-19 sont disponibles aux formats CSV, JSON, JSON-Lines et Parquet :

Tous les jeux de données modifiés ont des codes de sous-division ISO 3166 et des heures de chargement. Ils utilisent des noms de colonne en minuscules avec des traits de soulignement comme séparateurs.

Données brutes au format CSV

Les versions antérieures des données modifiées et brutes sont disponibles dans cette ressource.

Volume de données

Tous les jeux de données reçoivent des mises à jour quotidiennes. Le 5 mars 2023, ils contenaient 4 766 737 lignes. Le jeu de données est disponible dans ces formats de fichier :

  • CSV (560,3 Mo)
  • JSON (1515,6 Mo)
  • JSONL (1506,2 Mo)
  • Parquet (55,4 Mo)

Attribution des licences et des droits d’utilisation

Les données sont disponibles strictement à des fins éducatives et académiques sous ces conditions. Les objectifs valides sont les suivants :

  • établissements universitaires
  • agences gouvernementales
  • recherche médicale

Les données utilisées ou citées dans des publications doivent inclure une attribution à « Bing COVID-19 Tracker » avec un lien vers www.bing.com/covid.

Contact

Pour toute question ou tout commentaire sur ce jeu de données ou sur d’autres jeux de données dans le lac de données COVID-19, contactez askcovid19dl@microsoft.com.

Colonnes

Nom Type de données Unique Valeurs (exemple) Description
admin_region_1 string 864 Texas Géorgie Région dans country_region
admin_region_2 string 3,143 Comté de Washington Comté de Jefferson Région dans admin_region_1
confirmed int 120 692 1 2 Nombre de cas confirmés pour la région
confirmed_change int 12 120 1 2 Différence de cas confirmés par rapport au jour précédent
country_region string 237 États-Unis Inde Pays/région
deaths int 20 616 1 2 Nombre de décès pour la région
deaths_change SMALLINT 1 981 1 2 Différence de nombre de décès par rapport au jour précédent
id int 1 783 534 742546 69019298 Identificateur unique
iso_subdivision string 484 US-TX US-GA Codes de subdivision ISO en deux parties
iso2 string 226 US-IN Code pays à 2 lettres
iso3 string 226 USA IND Code pays à 3 lettres
latitude double 5 675 42.28708 19.59852 Latitude du centroïde de la région
load_time timestamp 1 2021-04-26 00:06:34.719000 Date et heure du chargement du fichier à partir de la source Bing sur GitHub
longitude double 5 693 -2,5396 -155,5186 Longitude du centroïde de la région
recovered int 73 287 1 2 Nombre de personnes guéries pour la région
recovered_change int 10 441 1 2 Différence de nombre de personnes guéries par rapport au jour précédent
date de mise à jour Date 457 2021-04-23 2021-04-22 Date de l’enregistrement

Préversion

id date de mise à jour confirmed deaths iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Monde entier null null null 26/04/2021 00:06:34
338996 2020-01-22 313 0 null null Monde entier null null null 26/04/2021 00:06:34 51 0
338997 23-01-2020 578 0 null null Monde entier null null null 26/04/2021 00:06:34 265 0
338998 2020-01-24 841 0 null null Monde entier null null null 26/04/2021 00:06:34 263 0
338999 2020-01-25 1320 0 null null Monde entier null null null 26/04/2021 00:06:34 479 0
339000 2020-01-26 2014 0 null null Monde entier null null null 26/04/2021 00:06:34 694 0
339001 2020-01-27 2798 0 null null Monde entier null null null 26/04/2021 00:06:34 784 0
339002 2020-01-28 4593 0 null null Monde entier null null null 26/04/2021 00:06:34 1795 0
339003 2020-01-29 6065 0 null null Monde entier null null null 26/04/2021 00:06:34 1472 0
339004 30-01-2020 7818 0 null null Monde entier null null null 26/04/2021 00:06:34 1753 0

Accès aux données - Azure Notebooks

Remarque

Ce notebook documente les URL et les exemples de code permettant d’accéder au jeu de données Bing COVID-19.

Utilisez ces URL pour obtenir des formats de fichier spécifiques hébergés dans le Stockage Blob Azure :

Téléchargez le fichier de jeu de données en utilisant la capacité intégrée de Pandas permettant de télécharger à partir d’une URL HTTP. Pandas comprend des visionneuses pour différents formats de fichiers :

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Pour vérifier que la colonne mise à jour a le format DateHeure, vérifiez les types de données des différents champs :

df.dtypes

Passez en revue les données mondiales. Pour visualiser les données, créez des graphiques :

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Accès aux données - Azure Databricks

Aucun échantillon disponible pour cette combinaison plateforme/package.

Accès aux données - Azure Synapse

Aucun échantillon disponible pour cette combinaison plateforme/package.

Étapes suivantes

Consultez les autres jeux de données du catalogue Open Datasets.