TextLoaderSaverCatalog.LoadFromTextFile Metoda

Definice

Přetížení

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parametry

path
String

Určuje soubor nebo cestu k souborům, ze kterých se má načíst.

options
TextLoader.Options

Definuje nastavení operace načítání.

Návraty

Příklady

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Platí pro

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametry

path
String

Cesta k souborům

columns
TextLoader.Column[]

Sloupce schématu.

separatorChar
Char

Znak použitý jako oddělovač mezi datovými body v řádku. Ve výchozím nastavení se znak tabulátoru používá jako oddělovač.

hasHeader
Boolean

Určuje, jestli soubor obsahuje záhlaví. Když truezavaděč přeskočí první řádek při Load(IMultiStreamSource) zavolání.

allowQuoting
Boolean

Určuje, jestli vstup může obsahovat dvojité uvozové hodnoty. Tento parametr slouží k rozlišení znaků oddělovače ve vstupní hodnotě od skutečných oddělovačů. Pokud truejsou oddělovače v uvozovkách považovány za součást vstupní hodnoty. Když falsese všechny oddělovače, i ty whitinové uvozovky, považují za oddělovač nového sloupce. Používá se také k rozlišení prázdných hodnot od chybějících hodnot. Pokud truejsou chybějící hodnoty označeny po sobě jdoucími oddělovači a prázdnými hodnotami podle "". Pokud falsejsou prázdné hodnoty označeny po sobě jdoucími oddělovači a chybějícími hodnotami ve výchozím nastavení chybí hodnota pro každý typ dokumentovaný v DataKind.

trimWhitespace
Boolean

Odeberte koncové prázdné znaky z čar.

allowSparse
Boolean

Zda vstup může obsahovat řídké reprezentace. Například řádek obsahující "5 2:6 4:3" znamená, že existují 5 sloupců a jediný nenulový je sloupec 2 a 4, který má hodnoty 6 a 3. Indexy sloupců jsou založené na nule, takže sloupce 2 a 4 představují třetí a 5. sloupce. Sloupec může mít také husté hodnoty následované řídkými hodnotami reprezentovanými tímto způsobem. Například řádek obsahující 1 2 5 5 2:6 4:3 představuje dva husté sloupce s hodnotami 1 a 2, následovanými 5 řídkými reprezentovanými sloupci s hodnotami 0, 0, 6, 0 a 3. Indexy řídkých sloupců začínají od 0, i když 0 představuje třetí sloupec.

Návraty

Zobrazení dat.

Platí pro

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Parametry typu

TInput

Parametry

path
String

Určuje soubor nebo cestu k souborům, ze kterých se má načíst.

options
TextLoader.Options

Definuje nastavení operace načítání. Není nutné zadat pole Sloupce, protože sloupce budou odvozeny touto metodou.

Návraty

Zobrazení dat.

Platí pro

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametry typu

TInput

Parametry

path
String

Cesta k souborům

separatorChar
Char

Znak oddělovače sloupců Výchozí hodnota je \t.

hasHeader
Boolean

Určuje, jestli soubor obsahuje záhlaví. Když truezavaděč přeskočí první řádek při Load(IMultiStreamSource) zavolání.

allowQuoting
Boolean

Určuje, jestli vstup může obsahovat dvojité uvozové hodnoty. Tento parametr slouží k rozlišení znaků oddělovače ve vstupní hodnotě od skutečných oddělovačů. Pokud truejsou oddělovače v uvozovkách považovány za součást vstupní hodnoty. Když falsese všechny oddělovače, i ty whitinové uvozovky, považují za oddělovač nového sloupce. Používá se také k rozlišení prázdných hodnot od chybějících hodnot. Pokud truejsou chybějící hodnoty označeny po sobě jdoucími oddělovači a prázdnými hodnotami podle "". Pokud falsejsou prázdné hodnoty označeny po sobě jdoucími oddělovači a chybějícími hodnotami ve výchozím nastavení chybí hodnota pro každý typ dokumentovaný v DataKind.

trimWhitespace
Boolean

Odeberte koncové prázdné znaky z čar.

allowSparse
Boolean

Zda vstup může obsahovat řídké reprezentace. Například řádek obsahující "5 2:6 4:3" znamená, že existují 5 sloupců a jediný nenulový je sloupec 2 a 4, který má hodnoty 6 a 3. Indexy sloupců jsou založené na nule, takže sloupce 2 a 4 představují třetí a 5. sloupce. Sloupec může mít také husté hodnoty následované řídkými hodnotami reprezentovanými tímto způsobem. Například řádek obsahující 1 2 5 5 2:6 4:3 představuje dva husté sloupce s hodnotami 1 a 2, následovanými 5 řídkými reprezentovanými sloupci s hodnotami 0, 0, 6, 0 a 3. Indexy řídkých sloupců začínají od 0, i když 0 představuje třetí sloupec.

Návraty

Zobrazení dat.

Platí pro