你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

StandardTokenizerV2 类

定义

按照 Unicode 文本分段规则划分文本。 此 tokenizer 是使用 Apache Lucene 实现的。 http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.StandardTokenizerV2")]
public class StandardTokenizerV2 : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.StandardTokenizerV2")>]
type StandardTokenizerV2 = class
    inherit Tokenizer
Public Class StandardTokenizerV2
Inherits Tokenizer
继承
StandardTokenizerV2
属性
Newtonsoft.Json.JsonObjectAttribute

构造函数

StandardTokenizerV2()

初始化 StandardTokenizerV2 类的新实例。

StandardTokenizerV2(String, Nullable<Int32>)

初始化 StandardTokenizerV2 类的新实例。

属性

MaxTokenLength

获取或设置最大令牌长度。 默认值为 255。 超过最大长度的标记将被拆分。 可以使用的最大令牌长度为 300 个字符。

Name

获取或设置 tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

(继承自 Tokenizer)

方法

Validate()

验证 对象。

适用于