Centro Europeu de Prevenção e Controlo das Doenças (ECDC) Casos de COVID-19

Os últimos dados públicos disponíveis sobre a distribuição geográfica dos casos de COVID-19 em todo o mundo do Centro Europeu de Prevenção e Controlo das Doenças (ECDC). Cada linha/entrada contém o número de novos casos comunicados por dia e por país ou região.

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Conjuntos de Dados

As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet, atualizadas diariamente:

Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.

Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume de dados

Desde 28 de maio de 2020, contêm 19 876 linhas (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Data source

Os dados brutos são ingeridos diariamente a partir do ficheiro csv do ECDC. Para mais informações sobre este conjunto de dados, incluindo as suas origens, consulte a página de recolha de dados do ECDC.

Qualidade de dados

O ECDC não garante a precisão ou atemporalidade dos dados. Leia a declaração de exoneração de responsabilidade.

Atribuição de licenças e direitos de utilização

Estes dados foram disponibilizados e podem ser utilizados conforme permitido ao abrigo da política de direitos de autor do ECDC aqui. Para quaisquer documentos em que os direitos de autor pertençam a terceiros, é necessário obter uma permissão de reprodução do titular dos direitos de autor.

O ECDC tem de ser sempre reconhecido como a fonte original destes dados. Esse reconhecimento deve ser incluído em cada cópia do material.

Contacto

Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Values (sample) Description
cases smallint 5,515 1 2 Número de casos reportados
continent_exp string 6 Europa África Nome do continente
countries_and_territories string 214 Canadá Bélgica Nome do país ou território
country_territory_code string 213 KOR ISL Código de três letras do país ou território
date_rep data 350 2020-12-11 2020-11-22 Data do relatório
Dia smallint 31 14 13 Dia do mês
Óbitos smallint 1.049 1 2 Número de mortes reportadas
geo_id string 214 CA SE Identificador geográfico
iso_country string 214 SE NÓS Código ISO 3166 do país ou região
load_date carimbo de data/hora 1 2021-04-26 00:06:22.123000 Data em que os dados foram carregados para o Azure
mês smallint 12 10 8 Número do mês
ano smallint 2 2020 2019 Anual

Pré-visualizar

date_rep Dia mês ano cases Óbitos countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afeganistão AF AFG Ásia 26/04/2021 12:06:22 AF

Acesso a dados

Azure Notebooks

Este bloco de notas documenta os URLs e o código de exemplo para aceder aos URLs do conjunto de dados de Casos de Covid-19 do Centro Europeu de Prevenção e Controlo das Doenças (ECDC) de diferentes formatos de ficheiro de conjunto de dados alojados no Armazenamento de Blobs do Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Transfira o ficheiro do conjunto de dados utilizando a capacidade de transferência incorporada a partir de um URL http no Pandas. Pandas tem leitores para vários formatos de arquivo:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Amostra não disponível para esta combinação de plataforma/pacote.

Azure Synapse

Amostra não disponível para esta combinação de plataforma/pacote.

Exemplos

Veja exemplos de como esse conjunto de dados pode ser usado:

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.