Bing COVID-19
Ежедневно обновляемые данные Bing COVID-19 включают подтвержденные случаи и случаи со смертельным исходом, а также случаи выздоровления из всех регионов. Трекер Bing COVID-19 отражает эти данные.
Bing собирает данные из нескольких доверенных, надежных источников, в том числе:
- Новости BNO
- Центры по контролю и профилактике заболеваний (CDC)
- Национальные или региональные и государственные департаменты здравоохранения
- Википедия
- Всемирная организация здравоохранения (ВОЗ)
- 24/7 Уолл-Сент.
Примечание.
Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.
Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.
Наборы данных
Измененные наборы данных Bing COVID-19 доступны в CSV, JSON, JSON, JSON-Lines и Parquet:
Все измененные наборы данных имеют коды подразделений ISO 3166 и время загрузки. Они используют имена столбцов нижнего регистра с разделителями подчеркивания.
Необработанные данные в формате CSV
В этом ресурсе доступны более ранние версии измененных и необработанных данных.
Объем данных
Все наборы данных получают ежедневные обновления. По состоянию на 5 марта 2023 г. они содержали 4 766 737 строк. Набор данных доступен в следующих форматах файлов:
- CSV (560,3 МБ)
- JSON (1515,6 МБ)
- JSONL (1506,2 МБ)
- Parquet (55,4 МБ)
Лицензия и права использования; определение принадлежности
Данные доступны строго для образовательных и академических целей в соответствии с этими условиями. Допустимые цели:
- академические учреждения
- государственные учреждения
- медицинские исследования
Данные, используемые или цитируемые в публикациях, должны включать в себя присвоение "Bing COVID-19 Tracker" с ссылкой на www.bing.com/covid.
Контакт
Для любых вопросов или отзывов об этих или других наборах данных в контакте askcovid19dl@microsoft.comCOVID-19 Data Lake.
Столбцы
Имя. | Тип данных | Уникальный | Значения (пример) | Description |
---|---|---|---|---|
admin_region_1 | строка | 864 | Техас, Джорджия | Region within country_region |
admin_region_2 | строка | 3143 | Округ Вашингтон, округ Джефферсон | Region within admin_region_1 |
confirmed | INT | 120 692 | 1 2 | Число подтвержденных случаев для региона |
confirmed_change | INT | 12 120 | 1 2 | Изменение в числе подтвержденных случаев по сравнению с предыдущим днем |
country_region | строка | 237 | США, Индия | Страна/регион |
deaths | INT | 20 616 | 1 2 | Число случаев смерти для региона |
deaths_change | smallint | 1981 | 1 2 | Изменение в числе случаев смерти по сравнению с предыдущим днем |
id | INT | 1 783 534 | 742546 69019298 | Уникальный идентификатор |
iso_subdivision | строка | 484 | US-TX US-GA | Двухкомпонентный код подразделения ISO |
iso2 | строка | 226 | US IN | Двухбуквенный код страны |
iso3 | строка | 226 | USA IND | Трехбуквенный код страны |
широта | двойной точности | 5675 | 42.28708 19.59852 | Широта центральной точки региона |
load_time | TIMESTAMP | 1 | 2021-04-26 00:06:34.719000 | Дата и время, когда файл был загружен из источника Bing в GitHub |
долгота | двойной точности | 5693 | –2.5396 –155.5186 | Долгота центральной точки региона |
recovered | INT | 73 287 | 1 2 | Число выздоровевших для региона |
recovered_change | INT | 10 441 | 1 2 | Изменение в числе выздоровевших по сравнению с предыдущим днем |
обновляется | Дата | 457 | 2021-04-23 2021-04-22 | Данные на дату регистрации |
Предварительный просмотр
id | обновляется | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 21.01.2020 | 262 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | ||
338996 | 2020-01-22 | 313 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | По всему миру | null | null | null | 4/26/2021 12:06:34 AM | 1753 | 0 |
Доступ к данным — записные книжки Azure
Примечание.
Эта записная книжка документирует URL-адреса и пример кода для доступа к набору данных Bing COVID-19.
Используйте эти URL-адреса для получения определенных форматов файлов, размещенных в Хранилище BLOB-объектов Azure:
Скачайте файл набора данных с помощью встроенной возможности Pandas для скачивания с URL-адреса HTTP. У Pandas есть средства чтения различных форматов файлов:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Чтобы убедиться, что обновленный столбец имеет формат datetime, проверьте типы данных различных полей:
df.dtypes
Просмотрите данные по всему миру. Чтобы визуализировать данные, создайте некоторые диаграммы:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Доступ к данным — Azure Databricks
Пример недоступен для этой платформы или сочетания пакетов.
Доступ к данным — Azure Synapse
Пример недоступен для этой платформы или сочетания пакетов.
Следующие шаги
Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.