Casos de COVID-19 do ECDC (Centro Europeu para Prevenção e Controle de Doenças)

Os dados públicos mais recentes disponíveis sobre a distribuição geográfica dos casos de COVID-19 no mundo do ECDC (Centro Europeu para Prevenção e Controle de Doenças). Cada linha/entrada contém o número de novos casos relatados por dia e por país ou região.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Conjunto de dados

As versões modificadas do conjunto de dados estão disponíveis em CSV, JSON, Linhas JSON e Parquet, atualizadas diariamente:

Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de usarem nomes de coluna em minúsculas com sublinhados como separadores.

Dados brutos: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume de dados

Em 28 de maio de 2020, eles continham 19.876 linhas (1,5 MB em CSV, 4,9 MB em JSON, 4,9 MB em JSONL e 54,1 KB em Parquet).

Fonte de dados

Os dados brutos são ingeridos diariamente do arquivo CSV do ECDC. Para obter mais informações sobre esse conjunto de dados, incluindo suas origens, consulte a página de coleta de dados do ECDC.

Qualidade dos dados

O ECDC não garante a precisão dos dados nem que eles estão atualizados. Leia o aviso de isenção de responsabilidade.

Atribuição de licença e direitos de uso

Esses dados foram disponibilizados e podem ser usados conforme permitido pela política de direitos autorais do ECDC aqui. Para obter documentos nos quais os direitos autorais estão com um terceiro, é necessário obter a permissão de reprodução do proprietário de direitos autorais.

O ECDC sempre precisa ser reconhecido como a fonte original desses dados. Tal reconhecimento precisa estar incluso em todas as cópias do material.

Contact

Caso tenha perguntas ou comentários sobre este ou outros conjuntos de dados do Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo) Descrição
cases SMALLINT 5\.515 1 2 Número de casos relatados
continent_exp string 6 Europa África Nome do continente
countries_and_territories string 214 Canadá Bélgica Nome do país ou do município
country_territory_code string 213 KOR ISL Código de três letras do país ou do território
date_rep date 350 2020-12-11 2020-11-22 Data do relatório
dia SMALLINT 31 14 13 Dia do mês
mortes SMALLINT 1\.049 1 2 Número de mortes relatadas
geo_id string 214 CA SE Identificador geográfico
iso_country string 214 SE US Código do país ou da região ISO 3166
load_date timestamp 1 2021-04-26 00:06:22.123000 Data em que os dados foram carregados no Azure
mês SMALLINT 12 10 8 Número do mês
ano SMALLINT 2 2020 2019 Year

Versão Prévia

date_rep dia mês ano cases mortes countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-13 13 12 2020 298 9 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-12 12 12 2020 113 11 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-11 11 12 2020 63 10 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-10 10 12 2020 202 16 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-09 9 12 2020 135 13 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-08 8 12 2020 200 6 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
07/12/2020 7 12 2020 210 26 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-06 6 12 2020 234 10 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF
2020-12-05 5 12 2020 235 18 Afeganistão AF AFG Ásia 26/04/2021 00:06:22 AF

Acesso de dados

Azure Notebooks

Este notebook documenta as URLs e o código de exemplo para acessar as URLs do conjunto de dados dos casos de Covid-19 do Centro Europeu para Prevenção e Controle de Doenças (ECDC) de diferentes formatos de arquivo do conjunto de dados hospedados no Armazenamento de Blobs do Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Exemplo não disponível para essa combinação de plataforma/pacote.

Azure Synapse

Exemplo não disponível para essa combinação de plataforma/pacote.

Exemplos

Veja exemplos de como esse conjunto de dados pode ser usado:

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.