Avrupa Hastalık Önleme ve Kontrol Merkezi (ECDC) COVID-19 Vakaları
Avrupa Hastalık Önleme ve Kontrol Merkezi'nden (ECDC) dünya çapında COVID-19 vakalarının coğrafi dağılımıyla ilgili en son genel veriler. Her satır/girdi, ülke veya bölge başına günlük olarak bildirilen yeni vaka sayısını içerir.
Not
Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.
Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.
Veri Kümeleri
Veri kümesinin değiştirilen sürümleri CSV, JSON, JSON-Lines ve Parquet biçiminde sunulur ve günlük olarak güncelleştirilir:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Değiştirilen tüm sürümlerde iso_country_region kodları ile yükleme süreleri bulunur ve alt çizgi ayıraçlar ile küçük harf sütun adları kullanılır.
Ham veriler: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Değiştirilen ve ham verilerin önceki sürümleri: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Veri hacmi
28 Mayıs 2020 itibarıyla 19.876 satır (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB) içerir.
Data source
Ham veriler, ECDC csv dosyasından günlük olarak alınmaktadır. Kaynakları da dahil olmak üzere bu veri kümesi hakkında daha fazla bilgi için ECDC veri toplama sayfasına bakın.
Veri kalitesi
ECDC, verilerin doğruluğunu veya zamanında sunulduğunu garanti etmez. Yasal uyarıyı okuyun.
Lisans ve kullanım hakları ilişkilendirmesi
Bu veriler, burada belirtilen ECDC telif hakkı ilkesi altında izin verilen şekilde kullanıma sunulur ve kullanılabilir. Telif hakkının bir üçüncü tarafa ait olduğu belgeler için yeniden oluşturma izni, telif hakkı sahibinden alınmalıdır.
ECDC her zaman bu verilerin özgün kaynağı olarak kabul edilmelidir. Bu tür bir bildirim, malzemenin her kopyasına dahil edilmelidir.
İlgili kişi
Bu veya COVID-19 Data Lake’teki diğer veri kümeleri hakkında sorularınız veya geri bildiriminiz için lütfen askcovid19dl@microsoft.com ile iletişime geçin.
Sütunlar
Veri Akışı Adı | Veri türü | Benzersiz | Değerler (örnek) | Açıklama |
---|---|---|---|---|
vakalar | smallint | 5,515 | 1 2 | Bildirilen vaka sayısı |
continent_exp | Dize | 6 | Avrupa Afrika | Kıta adı |
countries_and_territories | Dize | 214 | Kanada Belçika | Ülke veya bölge adı |
country_territory_code | Dize | Kategori 213 | KOR ISL | Üç harfli ülke veya bölge kodu |
date_rep | tarih | 350 | 2020-12-11 2020-11-22 | Rapor tarihi |
gün | smallint | 31 | 14 13 | Ayın günü |
Ölüm | smallint | 1,049 | 1 2 | Bildirilen ölü sayısı |
geo_id | Dize | 214 | CA SE | Coğrafi tanımlayıcı |
iso_country | Dize | 214 | SE ABD | ISO 3166 ülke veya bölge kodu |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Verilerin Azure’a yüklendiği tarih |
aya | smallint | 12 | 10 8 | Ay numarası |
yıl | smallint | 2 | 2020 2019 | Yıl |
Önizle
date_rep | gün | aya | yıl | vakalar | Ölüm | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganistan | AF | ALEMDAR | Asya | 26.04.2021 12:06:22 | AF |
Veri erişimi
Azure Notebooks
Bu not defteri, Azure Blob Depolama:¶ CSV'de barındırılan farklı veri kümesi dosya biçimlerinin Avrupa Hastalık Önleme ve Kontrol Merkezi (ECDC) Covid-19 Vakaları veri kümesi URL'lerine erişmek için URL'leri ve örnek kodu belgelemektedir:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Pandas'taki bir http URL'sinden yerleşik özellik indirme özelliğini kullanarak veri kümesi dosyasını indirin. Pandas'ın çeşitli dosya biçimleri için okuyucuları vardır:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Bu platform/paket bileşimi için örnek kullanılamıyor.
Azure Synapse
Bu platform/paket bileşimi için örnek kullanılamıyor.
Örnekler
Bu veri kümesinin nasıl kullanılabileceğini gösteren örneklere bakın:
- Synapse SQL sunucusuz uç noktası ile COVID verilerini analiz etme
- Azure Synapse Analytics'te SQL uç noktasını kullanarak COVID verileri üzerinde doğrusal regresyon analizi
Sonraki adımlar
Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.