MicrosoftLanguageStemmingTokenizer クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
言語固有のルールを使用してテキストが分割され、基本フォームに単語が減らされます。
[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")]
public class MicrosoftLanguageStemmingTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer")>]
type MicrosoftLanguageStemmingTokenizer = class
inherit Tokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits Tokenizer
- 継承
- 属性
-
Newtonsoft.Json.JsonObjectAttribute
コンストラクター
MicrosoftLanguageStemmingTokenizer() |
MicrosoftLanguageStemmingTokenizer クラスの新しいインスタンスを初期化します。 |
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>) |
MicrosoftLanguageStemmingTokenizer クラスの新しいインスタンスを初期化します。 |
プロパティ
IsSearchTokenizer |
トークナイザーの使用方法を示す値を取得または設定します。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。 |
Language |
使用する言語を取得または設定します。 既定値は英語です。 使用できる値は、'アラビア語'、'バングラ'、'ブルガリア語'、'カタロニア語'、'クロアチア語'、'チェコ語'、'デンマーク語'、'オランダ語'、'英語'、'エストニア語'、'finnish'、'french'、'german'、'greek'、'gujarati'、'ヘブライ'、'ヒンディー語'、'ハンガリー語'、'アイスランド語'、'インドネシア語'、'インドネシア語'、' 'italian'、'カンナダ'、'ラトビア語'、'リトアニア'、'マレー'、'マラヤーラム'、'marathi'、'norwegianBokmaal'、'polish'、'portuguese'、'portugueseBrazilian'、'punjabi'、'ルーマニア'、'russian'、'serbianCyrillic'、'セルビアンラティン'、'slovak'、'スロベニア'、'スペイン'、' 'スウェーデン語'、'タミル語'、'telugu'、'トルコ語'、'ウクライナ語'、'urdu' |
MaxTokenLength |
トークンの最大長を取得または設定します。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは、設定された最大トークン長に基づいて分割されます。 既定値は 255 です。 |
Name |
トークナイザーの名前を取得または設定します。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 Tokenizer) |
メソッド
Validate() |
オブジェクトを検証します。 |
適用対象
Azure SDK for .NET