Casos de COVID-19 do ECDC (Centro Europeu para Prevenção e Controle de Doenças)
Os dados públicos mais recentes disponíveis sobre a distribuição geográfica dos casos de COVID-19 no mundo do ECDC (Centro Europeu para Prevenção e Controle de Doenças). Cada linha/entrada contém o número de novos casos relatados por dia e por país ou região.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Conjunto de dados
As versões modificadas do conjunto de dados estão disponíveis em CSV, JSON, Linhas JSON e Parquet, atualizadas diariamente:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de usarem nomes de coluna em minúsculas com sublinhados como separadores.
Dados brutos: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volume de dados
Em 28 de maio de 2020, eles continham 19.876 linhas (1,5 MB em CSV, 4,9 MB em JSON, 4,9 MB em JSONL e 54,1 KB em Parquet).
Fonte de dados
Os dados brutos são ingeridos diariamente do arquivo CSV do ECDC. Para obter mais informações sobre esse conjunto de dados, incluindo suas origens, consulte a página de coleta de dados do ECDC.
Qualidade dos dados
O ECDC não garante a precisão dos dados nem que eles estão atualizados. Leia o aviso de isenção de responsabilidade.
Atribuição de licença e direitos de uso
Esses dados foram disponibilizados e podem ser usados conforme permitido pela política de direitos autorais do ECDC aqui. Para obter documentos nos quais os direitos autorais estão com um terceiro, é necessário obter a permissão de reprodução do proprietário de direitos autorais.
O ECDC sempre precisa ser reconhecido como a fonte original desses dados. Tal reconhecimento precisa estar incluso em todas as cópias do material.
Contact
Caso tenha perguntas ou comentários sobre este ou outros conjuntos de dados do Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.
Colunas
Nome | Tipo de dados | Exclusivo | Valores (exemplo) | Descrição |
---|---|---|---|---|
cases | SMALLINT | 5\.515 | 1 2 | Número de casos relatados |
continent_exp | string | 6 | Europa África | Nome do continente |
countries_and_territories | string | 214 | Canadá Bélgica | Nome do país ou do município |
country_territory_code | string | 213 | KOR ISL | Código de três letras do país ou do território |
date_rep | date | 350 | 2020-12-11 2020-11-22 | Data do relatório |
dia | SMALLINT | 31 | 14 13 | Dia do mês |
mortes | SMALLINT | 1\.049 | 1 2 | Número de mortes relatadas |
geo_id | string | 214 | CA SE | Identificador geográfico |
iso_country | string | 214 | SE US | Código do país ou da região ISO 3166 |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Data em que os dados foram carregados no Azure |
mês | SMALLINT | 12 | 10 8 | Número do mês |
ano | SMALLINT | 2 | 2020 2019 | Year |
Versão Prévia
date_rep | dia | mês | ano | cases | mortes | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
07/12/2020 | 7 | 12 | 2020 | 210 | 26 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afeganistão | AF | AFG | Ásia | 26/04/2021 00:06:22 | AF |
Acesso de dados
Azure Notebooks
Este notebook documenta as URLs e o código de exemplo para acessar as URLs do conjunto de dados dos casos de Covid-19 do Centro Europeu para Prevenção e Controle de Doenças (ECDC) de diferentes formatos de arquivo do conjunto de dados hospedados no Armazenamento de Blobs do Azure:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Exemplo não disponível para essa combinação de plataforma/pacote.
Azure Synapse
Exemplo não disponível para essa combinação de plataforma/pacote.
Exemplos
Veja exemplos de como esse conjunto de dados pode ser usado:
- Analisar dados de COVID com o ponto de extremidade sem servidor do SQL do Synapse
- Análise de regressão Linear em dados do COVID usando o ponto de extremidade SQL no Azure Synapse Analytics
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.