NycTlcGreen Classe
Representa o conjunto de dados públicos de corrida de táxi verde da Comissão de Táxis & Limusines de NYC.
Os registros de viagem de táxi verde incluem campos que capturam as datas/horas de partida e chegada, os locais de partida e chegada, as distâncias, as tarifas discriminadas, os tipos de taxa, os tipos de pagamento e as contagens de passageiro relatadas pelo motorista. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de coluna, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte Nyc Taxi & Limídice Commission - registros de corrida de táxi verde no catálogo do Microsoft Azure Open Datasets.
Para obter um exemplo de uso da classe NycTlcGreen, consulte o tutorial Usar o machine learning automatizado para prever tarifas de táxi.
Inicializar campos de filtragem.
- Herança
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
Construtor
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parâmetros
Nome | Description |
---|---|
start_date
|
A data na qual iniciar o carregamento de dados, inclusive. Se Nenhuma, Valor padrão: 2015-01-01 00:00:00
|
end_date
|
A data na qual terminar o carregamento de dados, inclusive. Se Nenhuma, Valor padrão: 2024-10-18 00:00:00
|
cols
|
Uma lista de nomes de coluna a serem carregados do conjunto de dados. Se Nenhuma, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte Nyc Taxi & Limídice Commission - green taxi trip records. Valor padrão: None
|
limit
|
Um valor que indica o número de dias de dados a serem carregados com Valor padrão: -1
|
enable_telemetry
|
Se a telemetria deve ser habilitada neste conjunto de dados. Valor padrão: True
|
start_date
Obrigatório
|
A data de início que você gostaria de consultar inclusive. |
end_date
Obrigatório
|
A data de término que você gostaria de consultar inclusive. |
cols
Obrigatório
|
Uma lista de nomes de coluna que você gostaria de recuperar. Nenhum obterá todas as colunas. |
limit
Obrigatório
|
to_pandas_dataframe() carregará apenas "limitar" meses de dados. -1 significa sem limite. |
enable_telemetry
Obrigatório
|
Indica se a telemetria deve ser enviada. |
Comentários
O exemplo abaixo mostra como acessar o conjunto de dados.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()