Microsoft.ML.Transforms.Text Пространство имен

Пространство имен, содержащее компоненты преобразования текстовых данных.

Классы

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>для .CustomStopWordsRemovingTransformer

CustomStopWordsRemovingEstimator.Options

Используйте средство удаления слов стоп-слов, которое может удалять список слов стоп-слов (наиболее распространенных слов), уже определенных в системе.

CustomStopWordsRemovingTransformer

ITransformer результатом установки CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

Преобразование LDA реализует LightLDA, новую реализацию латентного распределения Дирихлета.

LatentDirichletAllocationTransformer

ITransformer результатом установки LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Укажите сведения о разделах, обнаруженных LightLDA.

NgramExtractingEstimator

Создает вектор количества n-граммов (последовательности последовательных слов), встречающихся в входном тексте.

NgramExtractingTransformer

ITransformer в результате установки NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer>для .NgramHashingTransformer

NgramHashingTransformer

Пространство имен, содержащее компоненты преобразования текстовых данных.

StopWordsRemovingEstimator

IEstimator<TTransformer>для .CustomStopWordsRemovingTransformer

StopWordsRemovingEstimator.Options

Используйте средство удаления слов стоп-слов, которое может удалить список стоп-слов (наиболее распространенных слов), уже определенных в системе.

StopWordsRemovingTransformer

ITransformer результатом установки StopWordsRemovingEstimator.

TextFeaturizingEstimator

Оценщик, который превращает коллекцию текстовых документов в числовые векторы признаков. Векторы признаков нормализуются счетчиками слов и (или) знаков n-граммов (на основе предоставленных параметров).

TextFeaturizingEstimator.Options

Дополнительные параметры для TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer>для .TextNormalizingTransformer

TextNormalizingTransformer

ITransformer результатом установки TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer>для .TokenizingByCharactersTransformer

TokenizingByCharactersTransformer

ITransformer результатом установки TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer>для .ITransformer

WordBagEstimator.Options

Параметры извлечения n-граммов.

WordEmbeddingEstimator

Средство создания признаков текста, которое преобразует векторы текстовых маркеров в числовой вектор с помощью предварительно обученной модели внедрения.

WordEmbeddingTransformer

ITransformer в результате установки WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer>для .ITransformer

WordTokenizingEstimator

Маркеризирует входной текст с помощью указанных разделителей.

WordTokenizingTransformer

ITransformer в результате установки WordTokenizingEstimator.

Структуры

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Пространство имен, содержащее компоненты преобразования текстовых данных.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Пространство имен, содержащее компоненты преобразования текстовых данных.

Интерфейсы

IStopWordsRemoverOptions

Определяет поддерживаемый метод удаления стоп-слов.

Перечисления

NgramExtractingEstimator.WeightingCriteria

Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе. Это перечисление сериализуется.

StopWordsRemovingEstimator.Language

Язык стоп-слов. Это перечисление сериализуется.

TextFeaturizingEstimator.Language

Текстовый язык. Это перечисление сериализуется.

TextFeaturizingEstimator.NormFunction

Тип нормализатора текстового вектора.

TextNormalizingEstimator.CaseMode

Режим нормализации регистра текста. Это перечисление сериализуется.

WordEmbeddingEstimator.PretrainedModelKind

Указывает, какие встраивания слов следует использовать.