DataReference Clase
Representa una referencia a los datos de un almacén de datos.
DataReference representa una ruta de acceso de un almacén de datos y se puede usar para describir cómo y dónde deben estar disponibles los datos en una ejecución. Ya no es el enfoque recomendado para el acceso a datos y la entrega en Azure Machine Learning. El conjunto de datos admite el acceso a datos desde Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database y Azure Database for PostgreSQL a través de una interfaz unificada a la que se han agregado capacidades de administración de datos. Se recomienda usar el conjunto de datos para leer datos en los proyectos de aprendizaje automático.
Para más información sobre cómo usar el conjunto de datos de Azure ML en dos escenarios comunes, consulte los artículos:
- Creación y ejecución de canalizaciones de aprendizaje automático
- Creación de estimadores de entrenamiento
Constructor De clase DataReference.
- Herencia
-
builtins.objectDataReference
Constructor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parámetros
Nombre | Description |
---|---|
datastore
Requerido
|
El almacén de datos al que se hace referencia. |
data_reference_name
|
Nombre de la referencia de datos. Valor predeterminado: None
|
path_on_datastore
|
La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos. Valor predeterminado: None
|
mode
|
Operación en la referencia de datos. Los valores admitidos son "mount" (valor predeterminado) y "download". Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada.
En este caso, especifique la ruta de acceso con el parámetro En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución. Valor predeterminado: mount
|
path_on_compute
|
Ruta de acceso en el destino de proceso para la referencia de datos. Valor predeterminado: None
|
overwrite
|
Indica si se van a sobrescribir los datos existentes. Valor predeterminado: False
|
datastore
Requerido
|
El almacén de datos al que se hace referencia. |
data_reference_name
Requerido
|
Nombre de la referencia de datos. |
path_on_datastore
Requerido
|
La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos. |
mode
Requerido
|
Operación en la referencia de datos. Valores admitidos "mount" (valor predeterminado) y "download". Use el modo "download" (descarga) si el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) como datos de entrada.
En este caso, especifique la ruta de acceso con el parámetro En el modo "mount" (montaje), se crea un directorio temporal con los datos montados y se establece una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> con la ruta de acceso al directorio temporal. Si pasa DataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución. |
path_on_compute
Requerido
|
Ruta de acceso en el destino de proceso para la referencia de datos. |
overwrite
Requerido
|
Indica si se van a sobrescribir los datos existentes. |
Comentarios
DataReference define la ubicación de los datos y su uso en el enlace de proceso de destino ("mount" o "upload"). La ruta de acceso a los datos del almacén de datos puede ser la raíz "/", un directorio dentro del almacén de datos o un archivo de este.
Métodos
as_download |
Cambie la operación de referencia de datos que se va a descargar. La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_mount |
Cambie la operación de referencia de datos que se va a montar. El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_upload |
Cambie la operación de referencia de datos que se va a cargar. Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix. |
create |
Cree un objeto DataReference mediante DataPath y DataPathComputeBinding. |
path |
Cree una instancia de DataReference basada en la ruta de acceso especificada. |
to_config |
Convierta el objeto DataReference en el objeto DataReferenceConfiguration. |
as_download
Cambie la operación de referencia de datos que se va a descargar.
La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda el uso de un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_download(path_on_compute=None, overwrite=False)
Parámetros
Nombre | Description |
---|---|
path_on_compute
|
Ruta de acceso en el proceso para la referencia de datos. Valor predeterminado: None
|
overwrite
|
Indica si se van a sobrescribir los datos existentes. Valor predeterminado: False
|
Devoluciones
Tipo | Description |
---|---|
Nuevo objeto de referencia de datos. |
as_mount
Cambie la operación de referencia de datos que se va a montar.
El montaje de DataReference solo admite Azure Blob. Para montar datos en Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar un conjunto de datos de Azure Machine Learning. Para más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount()
Devoluciones
Tipo | Description |
---|---|
Nuevo objeto de referencia de datos. |
as_upload
Cambie la operación de referencia de datos que se va a cargar.
Para más información sobre qué procesos y almacenes de datos admiten la carga de los datos, consulte https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parámetros
Nombre | Description |
---|---|
path_on_compute
|
Ruta de acceso en el proceso para la referencia de datos. Valor predeterminado: None
|
overwrite
|
Indica si se van a sobrescribir los datos existentes. Valor predeterminado: False
|
Devoluciones
Tipo | Description |
---|---|
Nuevo objeto de referencia de datos. |
create
Cree un objeto DataReference mediante DataPath y DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parámetros
Nombre | Description |
---|---|
data_reference_name
|
Nombre de la referencia de datos que se va a crear. Valor predeterminado: None
|
datapath
|
[Obligatorio] Ruta de acceso de datos que se va a usar. Valor predeterminado: None
|
datapath_compute_binding
|
[Obligatorio] Enlace de proceso de la ruta de acceso a los datos que se va a usar. Valor predeterminado: None
|
Devoluciones
Tipo | Description |
---|---|
Objeto DataReference. |
path
Cree una instancia de DataReference basada en la ruta de acceso especificada.
path(path=None, data_reference_name=None)
Parámetros
Nombre | Description |
---|---|
path
|
Ruta de acceso en el almacén de datos. Valor predeterminado: None
|
data_reference_name
|
Nombre de la referencia de datos. Valor predeterminado: None
|
Devoluciones
Tipo | Description |
---|---|
Objeto de referencia de datos. |
to_config
Convierta el objeto DataReference en el objeto DataReferenceConfiguration.
to_config()
Devoluciones
Tipo | Description |
---|---|
Nuevo objeto DataReferenceConfiguration. |