NycTlcGreen Classe

Representa o conjunto de dados públicos de corrida de táxi verde da Comissão de Táxis & Limusines de NYC.

Os registros de viagem de táxi verde incluem campos que capturam as datas/horas de partida e chegada, os locais de partida e chegada, as distâncias, as tarifas discriminadas, os tipos de taxa, os tipos de pagamento e as contagens de passageiro relatadas pelo motorista. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de coluna, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte Nyc Taxi & Limídice Commission - registros de corrida de táxi verde no catálogo do Microsoft Azure Open Datasets.

Para obter um exemplo de uso da classe NycTlcGreen, consulte o tutorial Usar o machine learning automatizado para prever tarifas de táxi.

Inicializar campos de filtragem.

Herança
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Construtor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Nome Description
start_date

A data na qual iniciar o carregamento de dados, inclusive. Se Nenhuma, default_start_date será usado.

Valor padrão: 2015-01-01 00:00:00
end_date

A data na qual terminar o carregamento de dados, inclusive. Se Nenhuma, default_end_date será usado.

Valor padrão: 2024-10-18 00:00:00
cols

Uma lista de nomes de coluna a serem carregados do conjunto de dados. Se Nenhuma, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte Nyc Taxi & Limídice Commission - green taxi trip records.

Valor padrão: None
limit
int

Um valor que indica o número de dias de dados a serem carregados com to_pandas_dataframe(). Se não for especificado, o padrão de -1 significa nenhum limite de dias carregados.

Valor padrão: -1
enable_telemetry

Se a telemetria deve ser habilitada neste conjunto de dados.

Valor padrão: True
start_date
Obrigatório

A data de início que você gostaria de consultar inclusive.

end_date
Obrigatório

A data de término que você gostaria de consultar inclusive.

cols
Obrigatório

Uma lista de nomes de coluna que você gostaria de recuperar. Nenhum obterá todas as colunas.

limit
Obrigatório
int

to_pandas_dataframe() carregará apenas "limitar" meses de dados. -1 significa sem limite.

enable_telemetry
Obrigatório

Indica se a telemetria deve ser enviada.

Comentários

O exemplo abaixo mostra como acessar o conjunto de dados.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()