NycTlcFhv Classe

Representa o conjunto de dados público da Comissão de Táxis & Limusines de Nova York.

Esse conjunto de dados contém os registros de viagem de FHV (veículo alugado), que incluem os campos que capturam o número da licença de base de despacho e a data de coleta, a hora e a ID de localização da zona de táxi (arquivo de forma abaixo). Esses registros são gerados com base nos envios de Registro de viagem com FHV feitos pelas bases. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de coluna, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte Nyc Taxi & Limídice Commission - registros de viagem do veículo For-Hire (FHV) no catálogo do Microsoft Azure Open Datasets.

Inicializar campos de filtragem.

Herança
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

Construtor

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Nome Description
start_date

A data na qual iniciar o carregamento de dados, inclusive. Se Nenhuma, default_start_date será usado.

Valor padrão: 2015-01-01 00:00:00
end_date

A data na qual terminar o carregamento de dados, inclusive. Se Nenhuma, default_end_date será usado.

Valor padrão: 2024-10-18 00:00:00
cols

Uma lista de nomes de coluna a serem carregados do conjunto de dados. Se Nenhuma, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte Nyc Taxi & Limídice Commission – registros de viagem do veículo For-Hire (FHV).

Valor padrão: None
limit
int

Um valor que indica o número de dias de dados a serem carregados com to_pandas_dataframe(). Se não for especificado, o padrão de -1 significa nenhum limite de dias carregados.

Valor padrão: -1
enable_telemetry

Se a telemetria deve ser habilitada neste conjunto de dados.

Valor padrão: True
start_date
Obrigatório

A data de início que você gostaria de consultar inclusive.

end_date
Obrigatório

A data de término que você gostaria de consultar inclusive.

cols
Obrigatório

Uma lista de nomes de coluna que você gostaria de recuperar. Nenhum obterá todas as colunas.

limit
Obrigatório
int

to_pandas_dataframe() carregará apenas "limitar" meses de dados. -1 significa sem limite.

enable_telemetry
Obrigatório

Indica se a telemetria deve ser enviada.

Comentários

O exemplo abaixo mostra como acessar o conjunto de dados.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()