Centro Europeu de Prevenção e Controlo das Doenças (ECDC) Casos de COVID-19
Os últimos dados públicos disponíveis sobre a distribuição geográfica dos casos de COVID-19 em todo o mundo do Centro Europeu de Prevenção e Controlo das Doenças (ECDC). Cada linha/entrada contém o número de novos casos comunicados por dia e por país ou região.
Nota
A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Conjuntos de Dados
As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet, atualizadas diariamente:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.
Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volume de dados
Desde 28 de maio de 2020, contêm 19 876 linhas (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Data source
Os dados brutos são ingeridos diariamente a partir do ficheiro csv do ECDC. Para mais informações sobre este conjunto de dados, incluindo as suas origens, consulte a página de recolha de dados do ECDC.
Qualidade de dados
O ECDC não garante a precisão ou atemporalidade dos dados. Leia a declaração de exoneração de responsabilidade.
Atribuição de licenças e direitos de utilização
Estes dados foram disponibilizados e podem ser utilizados conforme permitido ao abrigo da política de direitos de autor do ECDC aqui. Para quaisquer documentos em que os direitos de autor pertençam a terceiros, é necessário obter uma permissão de reprodução do titular dos direitos de autor.
O ECDC tem de ser sempre reconhecido como a fonte original destes dados. Esse reconhecimento deve ser incluído em cada cópia do material.
Contacto
Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.
Colunas
Name | Tipo de dados | Exclusivo | Values (sample) | Description |
---|---|---|---|---|
cases | smallint | 5,515 | 1 2 | Número de casos reportados |
continent_exp | string | 6 | Europa África | Nome do continente |
countries_and_territories | string | 214 | Canadá Bélgica | Nome do país ou território |
country_territory_code | string | 213 | KOR ISL | Código de três letras do país ou território |
date_rep | data | 350 | 2020-12-11 2020-11-22 | Data do relatório |
Dia | smallint | 31 | 14 13 | Dia do mês |
Óbitos | smallint | 1.049 | 1 2 | Número de mortes reportadas |
geo_id | string | 214 | CA SE | Identificador geográfico |
iso_country | string | 214 | SE NÓS | Código ISO 3166 do país ou região |
load_date | carimbo de data/hora | 1 | 2021-04-26 00:06:22.123000 | Data em que os dados foram carregados para o Azure |
mês | smallint | 12 | 10 8 | Número do mês |
ano | smallint | 2 | 2020 2019 | Anual |
Pré-visualizar
date_rep | Dia | mês | ano | cases | Óbitos | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afeganistão | AF | AFG | Ásia | 26/04/2021 12:06:22 | AF |
Acesso a dados
Azure Notebooks
Este bloco de notas documenta os URLs e o código de exemplo para aceder aos URLs do conjunto de dados de Casos de Covid-19 do Centro Europeu de Prevenção e Controlo das Doenças (ECDC) de diferentes formatos de ficheiro de conjunto de dados alojados no Armazenamento de Blobs do Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Transfira o ficheiro do conjunto de dados utilizando a capacidade de transferência incorporada a partir de um URL http no Pandas. Pandas tem leitores para vários formatos de arquivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Amostra não disponível para esta combinação de plataforma/pacote.
Azure Synapse
Amostra não disponível para esta combinação de plataforma/pacote.
Exemplos
Veja exemplos de como esse conjunto de dados pode ser usado:
- Analise dados COVID com o ponto de extremidade sem servidor Synapse SQL
- Análise de regressão linear em dados COVID usando o ponto de extremidade SQL no Azure Synapse Analytics
Próximos passos
Exiba o restante dos conjuntos de dados no catálogo Open Datasets.