PatternTokenizer interface
正規表現パターン マッチングを使用して個別のトークンを構築するトークナイザー。 このトークナイザーは、Apache Lucene を使用して実装されます。
プロパティ
flags | 正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。 |
group | トークンに抽出する正規表現パターン内の一致するグループの 0 から始まる序数。 一致するグループに関係なく、パターン全体を使用して入力をトークンに分割する場合は、-1 を使用します。 既定値は -1 です。 既定値: -1。 |
name | トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 |
odatatype | ポリモーフィック識別子 |
pattern | トークンの区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: |
プロパティの詳細
flags
正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
プロパティ値
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
トークンに抽出する正規表現パターン内の一致するグループの 0 から始まる序数。 一致するグループに関係なく、パターン全体を使用して入力をトークンに分割する場合は、-1 を使用します。 既定値は -1 です。 既定値: -1。
group?: number
プロパティ値
number
name
トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。
name: string
プロパティ値
string
odatatype
ポリモーフィック識別子
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
プロパティ値
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
トークンの区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: \W+
。
pattern?: string
プロパティ値
string