Bing COVID-19
Les données COVID-19 de Bing incluent les cas confirmés, décédés et guéris de toutes les régions, mis à jour quotidiennement. La page Bing COVID-19 Tracker reflète ces données.
Bing collecte des données à partir de plusieurs sources fiables et approuvées, notamment :
- BNO News
- Centers for Disease Control and Prevention (CDC)
- Services de santé publique nationaux/régionaux et d’État
- Wikipedia
- L’Organisation mondiale de la santé (OMS)
- 24/7 Wall St.
Remarque
Microsoft fournit Azure Open Datasets « en l’état ». Microsoft n’offre aucune garantie, expresse ou implicite, ni de conditions relatives à votre utilisation des jeux de données. Dans la mesure autorisée par votre droit local, Microsoft décline toute responsabilité pour les dommages ou pertes, y compris directs, consécutifs, spéciaux, indirects ou punitifs, résultant de votre utilisation des jeux de données.
Ce jeu de données est fourni selon les conditions initiales par lesquelles Microsoft a reçu les données sources. Le jeu de données peut inclure des données provenant de Microsoft.
Groupes de données
Les jeux de données modifiés Bing COVID-19 sont disponibles aux formats CSV, JSON, JSON-Lines et Parquet :
Tous les jeux de données modifiés ont des codes de sous-division ISO 3166 et des heures de chargement. Ils utilisent des noms de colonne en minuscules avec des traits de soulignement comme séparateurs.
Les versions antérieures des données modifiées et brutes sont disponibles dans cette ressource.
Volume de données
Tous les jeux de données reçoivent des mises à jour quotidiennes. Le 5 mars 2023, ils contenaient 4 766 737 lignes. Le jeu de données est disponible dans ces formats de fichier :
- CSV (560,3 Mo)
- JSON (1515,6 Mo)
- JSONL (1506,2 Mo)
- Parquet (55,4 Mo)
Attribution des licences et des droits d’utilisation
Les données sont disponibles strictement à des fins éducatives et académiques sous ces conditions. Les objectifs valides sont les suivants :
- établissements universitaires
- agences gouvernementales
- recherche médicale
Les données utilisées ou citées dans des publications doivent inclure une attribution à « Bing COVID-19 Tracker » avec un lien vers www.bing.com/covid.
Contact
Pour toute question ou tout commentaire sur ce jeu de données ou sur d’autres jeux de données dans le lac de données COVID-19, contactez askcovid19dl@microsoft.com.
Colonnes
Nom | Type de données | Unique | Valeurs (exemple) | Description |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Géorgie | Région dans country_region |
admin_region_2 | string | 3,143 | Comté de Washington Comté de Jefferson | Région dans admin_region_1 |
confirmed | int | 120 692 | 1 2 | Nombre de cas confirmés pour la région |
confirmed_change | int | 12 120 | 1 2 | Différence de cas confirmés par rapport au jour précédent |
country_region | string | 237 | États-Unis Inde | Pays/région |
deaths | int | 20 616 | 1 2 | Nombre de décès pour la région |
deaths_change | SMALLINT | 1 981 | 1 2 | Différence de nombre de décès par rapport au jour précédent |
id | int | 1 783 534 | 742546 69019298 | Identificateur unique |
iso_subdivision | string | 484 | US-TX US-GA | Codes de subdivision ISO en deux parties |
iso2 | string | 226 | US-IN | Code pays à 2 lettres |
iso3 | string | 226 | USA IND | Code pays à 3 lettres |
latitude | double | 5 675 | 42.28708 19.59852 | Latitude du centroïde de la région |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Date et heure du chargement du fichier à partir de la source Bing sur GitHub |
longitude | double | 5 693 | -2,5396 -155,5186 | Longitude du centroïde de la région |
recovered | int | 73 287 | 1 2 | Nombre de personnes guéries pour la région |
recovered_change | int | 10 441 | 1 2 | Différence de nombre de personnes guéries par rapport au jour précédent |
date de mise à jour | Date | 457 | 2021-04-23 2021-04-22 | Date de l’enregistrement |
Préversion
id | date de mise à jour | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 51 | 0 |
338997 | 23-01-2020 | 578 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 1472 | 0 |
339004 | 30-01-2020 | 7818 | 0 | null | null | Monde entier | null | null | null | 26/04/2021 00:06:34 | 1753 | 0 |
Accès aux données - Azure Notebooks
Remarque
Ce notebook documente les URL et les exemples de code permettant d’accéder au jeu de données Bing COVID-19.
Utilisez ces URL pour obtenir des formats de fichier spécifiques hébergés dans le Stockage Blob Azure :
Téléchargez le fichier de jeu de données en utilisant la capacité intégrée de Pandas permettant de télécharger à partir d’une URL HTTP. Pandas comprend des visionneuses pour différents formats de fichiers :
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Pour vérifier que la colonne mise à jour a le format DateHeure, vérifiez les types de données des différents champs :
df.dtypes
Passez en revue les données mondiales. Pour visualiser les données, créez des graphiques :
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Accès aux données - Azure Databricks
Aucun échantillon disponible pour cette combinaison plateforme/package.
Accès aux données - Azure Synapse
Aucun échantillon disponible pour cette combinaison plateforme/package.
Étapes suivantes
Consultez les autres jeux de données du catalogue Open Datasets.