Bing COVID-19

Os dados de COVID-19 do Bing incluem os casos confirmados, fatais e recuperados de todas as regiões, atualizados diariamente. O Rastreador de COVID-19 do Bing reflete esses dados.

O Bing coleta dados de várias fontes confiáveis e confiáveis, incluindo:

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Conjunto de dados

Os conjuntos de dados de COVID-19 modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet:

Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados. Eles usam nomes de coluna de minúsculas com separadores de sublinhado.

Dados brutos em formato CSV

Versões anteriores de dados modificados e brutos estão disponíveis neste recurso.

Volume de dados

Todos os conjuntos de dados recebem atualizações diárias. A partir de 05 de março de 2023, continham 4.766.737 linhas. O conjunto de dados está disponível nestes formatos de arquivo:

  • CSV (560,3 MB)
  • JSON (1515,6 MB)
  • JSONL (1506,2 MB)
  • Parquet (55,4 MB)

Atribuição de licença e direitos de uso

Os dados estão disponíveis estritamente para fins educacionais e acadêmicos sob esses termos e condições. As finalidades válidas incluem:

  • instituições acadêmicas
  • agências governamentais
  • investigação médica

Os dados usados ou citados em publicações devem incluir uma atribuição para o "Rastreador de COVID-19 do Bing" com um link para www.bing.com/covid.

Contato

Para dúvidas ou comentários sobre este ou outros conjuntos de dados no Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo) Descrição
admin_region_1 string 864 Texas Georgia Região em country_region
admin_region_2 string 3.143 Condado de Jefferson do Condado de Washington Região em admin_region_1
confirmado INT 120.692 1 2 Contagem dos casos confirmados na região
confirmed_change INT 12.120 1 2 Alteração na contagem de casos confirmados do dia anterior
country_region string 237 Estados Unidos Índia País/Região
mortes INT 20.616 1 2 Contagem dos casos de mortes por região
deaths_change SMALLINT 1\.981 1 2 Alteração na contagem de mortes do dia anterior
id INT 1\.783.534 742546 69019298 Identificador exclusivo
iso_subdivision string 484 US-TX US-GA Código de subdivisão ISO de duas partes
iso2 string 226 US IN Identificador de código do país de duas letras
iso3 string 226 USA IND Identificador de código do país de três letras
latitude double 5\.675 42.28708 19.59852 Latitude do centroide da região
load_time timestamp 1 2021-04-26 00:06:34.719000 A data e hora em que o arquivo foi carregado da origem do Bing no GitHub
longitude double 5\.693 -2.5396 -155.5186 Longitude do centroide da região
recuperados INT 73.287 1 2 Contagem dos recuperados na região
recovered_change INT 10.441 1 2 Alteração na contagem de casos recuperados do dia anterior
atualizado date 457 2021-04-23 2021-04-22 A data no momento do registro

Versão Prévia

id atualizado confirmado mortes iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 21/01/2020 262 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34
338996 22/01/2020 313 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 51 0
338997 23/01/2020 578 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 265 0
338998 24/01/2020 841 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 263 0
338999 25/01/2020 1320 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 479 0
339000 26/01/2020 2014 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 694 0
339001 27/01/2020 2798 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 784 0
339002 28/01/2020 4593 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1795 0
339003 29/01/2020 6065 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1.472 0
339004 30/01/2020 7818 0 nulo nulo No mundo inteiro nulo nulo nulo 26/04/2021 00:06:34 1753 0

Acesso a dados – Azure Notebooks

Observação

Este notebook documenta as URLs e o código de exemplo para acessar conjunto de dados de COVID-19 do Bing.

Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:

Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL HTTP no Pandas. O Pandas tem leitores para vários formatos de arquivo:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Para verificar se a coluna atualizada tem formato de data e hora, verifique os tipos de dados dos vários campos:

df.dtypes

Examine os dados em todo o mundo. Para visualizar os dados, crie alguns gráficos:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Acesso a dados – Azure Databricks

Amostra não disponível para essa combinação de plataforma/pacote.

Acesso a dados – Azure Synapse

Amostra não disponível para essa combinação de plataforma/pacote.

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.