MicrosoftLanguageStemmingTokenizer クラス

定義

言語固有のルールを使用してテキストが分割され、基本フォームに単語が減らされます。

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")]
public class MicrosoftLanguageStemmingTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")>]
type MicrosoftLanguageStemmingTokenizer = class
    inherit Tokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits Tokenizer
継承
MicrosoftLanguageStemmingTokenizer
属性
Newtonsoft.Json.JsonObjectAttribute

コンストラクター

MicrosoftLanguageStemmingTokenizer()

MicrosoftLanguageStemmingTokenizer クラスの新しいインスタンスを初期化します。

MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>)

MicrosoftLanguageStemmingTokenizer クラスの新しいインスタンスを初期化します。

プロパティ

IsSearchTokenizer

トークナイザーの使用方法を示す値を取得または設定します。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。

Language

使用する言語を取得または設定します。 既定値は英語です。 使用できる値は、'アラビア語'、'バングラ'、'ブルガリア語'、'カタロニア語'、'クロアチア語'、'チェコ語'、'デンマーク語'、'オランダ語'、'英語'、'エストニア語'、'finnish'、'french'、'german'、'greek'、'gujarati'、'ヘブライ'、'ヒンディー語'、'ハンガリー語'、'アイスランド語'、'インドネシア語'、'インドネシア語'、' 'italian'、'カンナダ'、'ラトビア語'、'リトアニア'、'マレー'、'マラヤーラム'、'marathi'、'norwegianBokmaal'、'polish'、'portuguese'、'portugueseBrazilian'、'punjabi'、'ルーマニア'、'russian'、'serbianCyrillic'、'セルビアンラティン'、'slovak'、'スロベニア'、'スペイン'、' 'スウェーデン語'、'タミル語'、'telugu'、'トルコ語'、'ウクライナ語'、'urdu'

MaxTokenLength

トークンの最大長を取得または設定します。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは、設定された最大トークン長に基づいて分割されます。 既定値は 255 です。

Name

トークナイザーの名前を取得または設定します。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

(継承元 Tokenizer)

メソッド

Validate()

オブジェクトを検証します。

適用対象