Bing COVID-19

Bing COVID-19 データには、すべてのリージョンからの確定、重症、回復した症例が含まれ、毎日更新されます。 Bing COVID-19 トラッカーには、このデータが反映されています。

Bing は、次のような信頼性の高い複数のソースからデータを収集します。

Note

Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。

このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。

データセット

編集された Bing COVID-19 データセットは、CSV、JSON、JSON-Lines、Parquet で提供されます。

すべての編集済みデータセットには、ISO 3166 下位コードと読み込み時間が追加されています。 小文字の列名とアンダースコアの区切り記号が使用されています。

CSV 形式の生データ

以前のバージョンの編集済みデータおよび生データは、こちらのリソースで提供されています。

データ ボリューム

すべてのデータセットは毎日更新されます。 2023 年 3 月 5 日の時点で、4,766,737 行が含まれています。 データセットは、次のファイル形式で提供されています。

  • CSV (560.3 MB)
  • JSON (1515.6 MB)
  • JSONL (1506.2 MB)
  • Parquet (55.4 MB)

ライセンスと使用権の帰属

本データは、これらの使用条件に従い、教育および学術目的に限定して使用できます。 有効な目的は次のとおりです。

  • 教育機関
  • 政府機関
  • 医療研究

出版物で使用または引用されているデータには、'Bing COVID-19 トラッカー' の帰属と www.bing.com/covid のリンクを含める必要があります。

お問い合わせ先

COVID-19 Data Lake のこのデータセットまたはその他のデータセットに関する質問またはフィードバックがある場合は、askcovid19dl@microsoft.com にご連絡ください。

Name データ型 一意 値 (サンプル) 説明
admin_region_1 string 864 Texas Georgia country_region 内のリージョン
admin_region_2 string 3,143 Washington County Jefferson County admin_region_1 内のリージョン
confirmed INT 120,692 1 2 リージョンの確定者数
confirmed_change INT 12,120 1 2 前日からの確定者数の変更
country_region string 237 United States India 国/リージョン
deaths INT 20,616 1 2 リージョンの死亡者数
deaths_change smallint 1,981 1 2 前日からの死亡者の変更
id INT 1,783,534 742546 69019298 一意識別子
iso_subdivision string 484 US-TX US-GA 2 つの部分から成る ISO 下位コード
iso2 string 226 US IN 2 文字の国番号識別子
iso3 string 226 USA IND 3 文字の国番号識別子
緯度 (latitude) double 5,675 42.28708 19.59852 リージョンの中心の緯度
load_time timestamp 1 2021-04-26 00:06:34.719000 ファイルが GitHub 上の Bing ソースから読み込まれた日時
経度 (longitude) double 5,693 -2.5396 -155.5186 リージョンの中心の経度
recovered INT 73,287 1 2 リージョンの回復者数
recovered_change INT 10,441 1 2 前日からの回復者数の変更
更新済み date 457 2021-04-23 2021-04-22 レコードの現時点

プレビュー

id 更新済み confirmed deaths iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM
338996 2020-01-22 313 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 51 0
338997 2020-01-23 578 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 265 0
338998 2020-01-24 841 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 263 0
338999 2020-01-25 1320 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 479 0
339000 2020-01-26 2014 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 694 0
339001 2020-01-27 2798 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 784 0
339002 2020-01-28 4593 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 1795 0
339003 2020-01-29 6065 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 1472 0
339004 2020-01-30 7818 0 null null 世界全域 null null null 4/26/2021 12:06:34 AM 1753 0

データ アクセス - Azure Notebooks

Note

このノートブックには、Bing COVID-19 データセットにアクセスするための URL とサンプル コードが記載されています。

Azure Blob Storage にホストされている特定のファイル形式を取得するには、次の URL を使用します。

Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを HTTP URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

更新された列が datetime 形式であることを確認するには、さまざまなフィールドのデータ型を確認します。

df.dtypes

世界規模のデータを確認します。 データを視覚化するには、グラフを作成します。

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

データ アクセス - Azure Databricks

このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。

データ アクセス - Azure Synapse

このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。

次のステップ

Open Datasets カタログの残りのデータセットを表示します。