Microsoft.ML.Transforms.Text Пространство имен
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Пространство имен, содержащее компоненты преобразования текстовых данных.
Классы
CustomStopWordsRemovingEstimator |
IEstimator<TTransformer>для .CustomStopWordsRemovingTransformer |
CustomStopWordsRemovingEstimator.Options |
Используйте средство удаления слов стоп-слов, которое может удалять список слов стоп-слов (наиболее распространенных слов), уже определенных в системе. |
CustomStopWordsRemovingTransformer |
ITransformer результатом установки CustomStopWordsRemovingEstimator. |
LatentDirichletAllocationEstimator |
Преобразование LDA реализует LightLDA, новую реализацию латентного распределения Дирихлета. |
LatentDirichletAllocationTransformer |
ITransformer результатом установки LatentDirichletAllocationEstimator. |
LatentDirichletAllocationTransformer.ModelParameters |
Укажите сведения о разделах, обнаруженных LightLDA. |
NgramExtractingEstimator |
Создает вектор количества n-граммов (последовательности последовательных слов), встречающихся в входном тексте. |
NgramExtractingTransformer |
ITransformer в результате установки NgramExtractingEstimator. |
NgramHashingEstimator | |
NgramHashingTransformer |
Пространство имен, содержащее компоненты преобразования текстовых данных. |
StopWordsRemovingEstimator |
IEstimator<TTransformer>для .CustomStopWordsRemovingTransformer |
StopWordsRemovingEstimator.Options |
Используйте средство удаления слов стоп-слов, которое может удалить список стоп-слов (наиболее распространенных слов), уже определенных в системе. |
StopWordsRemovingTransformer |
ITransformer результатом установки StopWordsRemovingEstimator. |
TextFeaturizingEstimator |
Оценщик, который превращает коллекцию текстовых документов в числовые векторы признаков. Векторы признаков нормализуются счетчиками слов и (или) знаков n-граммов (на основе предоставленных параметров). |
TextFeaturizingEstimator.Options |
Дополнительные параметры для TextFeaturizingEstimator. |
TextNormalizingEstimator | |
TextNormalizingTransformer |
ITransformer результатом установки TextNormalizingEstimator. |
TokenizingByCharactersEstimator |
IEstimator<TTransformer>для .TokenizingByCharactersTransformer |
TokenizingByCharactersTransformer |
ITransformer результатом установки TokenizingByCharactersEstimator. |
WordBagEstimator | |
WordBagEstimator.Options |
Параметры извлечения n-граммов. |
WordEmbeddingEstimator |
Средство создания признаков текста, которое преобразует векторы текстовых маркеров в числовой вектор с помощью предварительно обученной модели внедрения. |
WordEmbeddingTransformer |
ITransformer в результате установки WordEmbeddingEstimator. |
WordHashBagEstimator | |
WordTokenizingEstimator |
Маркеризирует входной текст с помощью указанных разделителей. |
WordTokenizingTransformer |
ITransformer в результате установки WordTokenizingEstimator. |
Структуры
LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Пространство имен, содержащее компоненты преобразования текстовых данных. |
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Пространство имен, содержащее компоненты преобразования текстовых данных. |
Интерфейсы
IStopWordsRemoverOptions |
Определяет поддерживаемый метод удаления стоп-слов. |
Перечисления
NgramExtractingEstimator.WeightingCriteria |
Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе. Это перечисление сериализуется. |
StopWordsRemovingEstimator.Language |
Язык стоп-слов. Это перечисление сериализуется. |
TextFeaturizingEstimator.Language |
Текстовый язык. Это перечисление сериализуется. |
TextFeaturizingEstimator.NormFunction |
Тип нормализатора текстового вектора. |
TextNormalizingEstimator.CaseMode |
Режим нормализации регистра текста. Это перечисление сериализуется. |
WordEmbeddingEstimator.PretrainedModelKind |
Указывает, какие встраивания слов следует использовать. |