Feriados

Dados de feriados nacionais de todo o mundo obtidos com base nos pacotes de férias PyPI e na Wikipedia, abrangendo 38 países ou regiões de 1970 a 2099.

Cada linha indica as informações de feriados para uma data, um país ou uma região específicos e se a maioria das pessoas não vê o ordenado sofrer descontos por esses dias.

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Volume e retenção

Este conjunto de dados é armazenado no formato Parquet. É um instantâneo com informações de feriados de 1º de janeiro de 1970 a 1º de janeiro de 2099. O tamanho dos dados é de aproximadamente 500 KB.

Localização de armazenamento

Este conjunto de dados é armazenado na região do Azure E.U.A. Leste. Recomendamos localizar recursos de computação no leste dos EUA por afinidade.

Informações adicionais

Este conjunto de dados combina dados obtidos na Wikipedia (WikiMedia Foundation Inc) e com base nos pacotes de férias PyPI.

O conjunto de dados combinado é fornecido ao abrigo da Licença Attribution-ShareAlike 3.0 Unported da Creative Commons.

Se tiver dúvidas sobre a origem de dados, envie um e-mail para aod@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Values (sample) Description
paísOrRegião string 38 Suécia Noruega Nome completo do país ou região.
countryRegionCode string 35 SE NÃO O código do país ou região de acordo com o formato que pode encontrar aqui.
data carimbo de data/hora 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 A data do feriado.
holidayName string 483 Søndag Söndag Nome completo do feriado.
isPaidTimeOff boolean 3 True Indique se a maioria das pessoas pagou folga nesta data (disponível apenas para os EUA, Reino Unido e Índia agora). Se for nulo, significa "desconhecido".
normalizeHolidayName string 438 Søndag Söndag Nome normalizado do feriado.

Pré-visualizar

paísOrRegião holidayName normalizeHolidayName countryRegionCode data
Noruega Søndag Søndag Não 28/12/2098 12:00:00
Suécia Söndag Söndag SE 28/12/2098 12:00:00
Austrália Dia do Boxe Dia do Boxe AU 26/12/2098 12:00:00
Hungria Karácsony másnapja Karácsony másnapja HU 26/12/2098 12:00:00
Áustria Stefanitag Stefanitag AT 26/12/2098 12:00:00
Canadá Dia do Boxe Dia do Boxe CA 26/12/2098 12:00:00
Croácia Sveti Stjepan Sveti Stjepan HR 26/12/2098 12:00:00
Checo 2. Vátek Vánoční 2. Vátek Vánoční CZ 26/12/2098 12:00:00

Acesso a dados

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://video2.skills-academy.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.