歐洲疾病預防控制中心 (ECDC) COVID-19 案例

由歐洲疾病預防控制中心 (ECDC) 提供的全球新型冠狀病毒 (COVID-19) 病例地理分佈最新公開資料。 每個資料列/項目均包含各個國家或地區每日通報的新病例。

注意

Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料集

已修改的資料集版本提供 CSV、JSON、JSON-Lines 與 Parquet 格式,並且每日更新:

所有已修改的資料集皆新增了 iso_country_region 代碼和載入時間,並使用以底線分隔的小寫資料行名稱。

未經處理資料:https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

已修改及未經處理的舊版資料:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

資料量

截至 2020 年 5月 28 日為止,這些資料集包含了 19,876 個資料列 (CSV 1.5 MB、JSON 4.9 MB、JSONL 4.9 MB、Parquet 54.1 KB)。

資料來源

每日皆會從 ECDC csv 檔案擷取未經處理的資料。 如需此資料集的詳細資訊,包括其來源,請參閱 ECDC 資料收集頁面

資料品質

ECDC 不保證該資料的正確性或時效性。 閱讀免責聲明

授權和使用權限出處

此資料的提供與使用方式,均依循此處的 ECDC 著作權原則。 若文件的著作權屬於第三方,就必須獲得著作權人同意,才可進行重製。

ECDC 必須一律被公認為此資料的原始來源。 每份資料複本都必須包含這樣的認知。

連絡人

對於新型冠狀病毒 (COVID-19) Data Lake 中的這個資料集或其他資料集如有任何問題,請連絡 askcovid19dl@microsoft.com。

資料行

名稱 資料類型 唯一 Values (sample) 描述
案例 smallint 5,515 1 2 通報的案例數
continent_exp string 6 Europe Africa 大陸名稱
countries_and_territories string 214 Canada Belgium 國家/地區名稱
country_territory_code string 213 KOR ISL 三個字母的國家/地區代碼
date_rep date 350 2020-12-11 2020-11-22 通報的日期
smallint 31 14 13 當月天數
deaths smallint 1,049 1 2 通報的死亡數
geo_id string 214 CA SE 地理位置識別碼
iso_country string 214 SE US ISO 3166 國碼或地區碼
load_date timestamp 1 2021-04-26 00:06:22.123000 資料載入 Azure 的日期
個月 smallint 12 10 8 月份數
year SMALLINT 2 2020 2019 Year

預覽​​

date_rep 個月 year 案例 deaths countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-13 13 12 2020 298 9 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-12 12 12 2020 113 11 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-11 11 12 2020 63 10 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-10 10 12 2020 202 16 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-09 9 12 2020 135 13 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020 年 12 月 8 日 8 12 2020 200 6 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-07 7 12 2020 210 26 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-06 6 12 2020 234 10 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF
2020-12-05 5 12 2020 235 18 阿富汗 AF AFG 亞洲 4/26/2021 12:06:22 AM AF

資料存取

Azure Notebooks

此筆記本會記載 URL 和範例程式碼,以存取不同資料集檔案格式的歐洲疾病預防控制中心 (ECDC) Covid-19 案例資料集 URL,其裝載於 Azure Blob 儲存體上:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSON:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

使用 Pandas 中從 HTTP URL 下載的內建功能,下載資料集檔案。 Pandas 具有各種檔案格式的讀取器:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

此平台/封裝組合沒有可用的樣本。

Azure Synapse

此平台/封裝組合沒有可用的樣本。

範例

請參閱如何使用此資料集的範例:

下一步

檢視開放資料集目錄中的其餘資料集。