你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

MicrosoftLanguageStemmingTokenizer 类

参考

使用特定于语言的规则划分文本，并将各字词缩减为其原形。

必须填充所有必需的参数才能发送到 Azure。

继承: azure.search.documents.indexes._generated.models._models_py3.LexicalTokenizer

MicrosoftLanguageStemmingTokenizer

构造函数

MicrosoftLanguageStemmingTokenizer(*, name: str, max_token_length: int = 255, is_search_tokenizer: bool = False, language: str | _models.MicrosoftStemmingTokenizerLanguage | None = None, **kwargs: Any)

仅限关键字的参数

名称	说明
name	str tokenizer 的名称。它必须仅包含字母、数字、空格、短划线或下划线，只能以字母数字字符开头和结尾，且最多包含 128 个字符。必需。
max_token_length	int 最大令牌长度。超过最大长度的标记将被拆分。可以使用的最大标记长度为 300 个字符。长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌，然后根据设置的最大令牌长度拆分每个令牌。默认值为 255。默认值: 255
is_search_tokenizer	bool 一个指示如何使用 tokenizer 的值。如果用作搜索 tokenizer，则设置为 true;如果用作索引标记器，则设置为 false。默认值为 false。
language	str 或 <xref:search_service_client.models.MicrosoftStemmingTokenizerLanguage> 要使用的语言。默认值为英语。已知值为：“arabic”、“bangla”、“保加利亚”、“加泰罗尼亚”、“克罗地亚”、“捷克”、“丹麦”、“荷兰”、“英语”、“爱沙尼亚语”、“芬兰语”、“法语”、“德语”、“希腊”、“古吉拉特语”、“希伯来语”、“印地语”、“匈牙利语”、“冰岛语”、 “印尼语”、“意大利人”、“卡纳达达”、“拉脱维亚语”、“立陶宛语”、“马来语”、“马拉雅拉姆语”、“马拉雅拉姆语”、“马拉蒂语”、“挪威语Bokmaal”、“波兰”、“葡萄牙语”、“葡萄牙语”、“葡萄牙语”、旁遮普语、罗马尼亚语、俄罗斯语、塞尔维亚语、塞尔维亚语、塞尔维亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、”swedish“、”tamil“、”telugu“、”turkish“、”乌克兰“和”urdu”。

变量

名称	说明
odata_type	str 指定 tokenizer 类型的 URI 片段。必需。
name	str tokenizer 的名称。它必须仅包含字母、数字、空格、短划线或下划线，只能以字母数字字符开头和结尾，且最多包含 128 个字符。必需。
max_token_length	int 最大令牌长度。超过最大长度的标记将被拆分。可以使用的最大标记长度为 300 个字符。长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌，然后根据设置的最大令牌长度拆分每个令牌。默认值为 255。
is_search_tokenizer	bool 一个指示如何使用 tokenizer 的值。如果用作搜索 tokenizer，则设置为 true;如果用作索引标记器，则设置为 false。默认值为 false。
language	str 或 <xref:search_service_client.models.MicrosoftStemmingTokenizerLanguage> 要使用的语言。默认值为英语。已知值为：“arabic”、“bangla”、“保加利亚”、“加泰罗尼亚”、“克罗地亚”、“捷克”、“丹麦”、“荷兰”、“英语”、“爱沙尼亚语”、“芬兰语”、“法语”、“德语”、“希腊”、“古吉拉特语”、“希伯来语”、“印地语”、“匈牙利语”、“冰岛语”、 “印尼语”、“意大利人”、“卡纳达达”、“拉脱维亚语”、“立陶宛语”、“马来语”、“马拉雅拉姆语”、“马拉雅拉姆语”、“马拉蒂语”、“挪威语Bokmaal”、“波兰”、“葡萄牙语”、“葡萄牙语”、“葡萄牙语”、旁遮普语、罗马尼亚语、俄罗斯语、塞尔维亚语、塞尔维亚语、塞尔维亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、”swedish“、”tamil“、”telugu“、”turkish“、”乌克兰“和”urdu”。

方法

as_dict	返回可使用 json.dump 进行序列化的 dict。高级用法可以选择使用回调作为参数： Key 是 Python 中使用的属性名称。 Attr_desc是元数据的一个听写。当前包含具有 msrest 类型的“type”和包含 RestAPI 编码键的“key”。值是此对象中的当前值。返回的字符串将用于序列化密钥。如果返回类型是列表，则这被视为分层结果听写。请参阅此文件中的三个示例： attribute_transformer full_restapi_key_transformer last_restapi_key_transformer 如果需要 XML 序列化，可以传递 kwargs is_xml=True。
deserialize	使用 RestAPI 语法分析 str 并返回模型。
enable_additional_properties_sending
from_dict	使用给定的键提取程序分析 dict 返回一个模型。默认情况下，请考虑密钥提取程序 (rest_key_case_insensitive_extractor、attribute_key_case_insensitive_extractor和last_rest_key_case_insensitive_extractor)
is_xml_model
serialize	返回将从此模型发送到服务器的 JSON。这是as_dict (full_restapi_key_transformer的别名，keep_readonly=False) 。如果需要 XML 序列化，可以传递 kwargs is_xml=True。

as_dict

返回可使用 json.dump 进行序列化的 dict。

高级用法可以选择使用回调作为参数：

Key 是 Python 中使用的属性名称。 Attr_desc是元数据的一个听写。当前包含具有 msrest 类型的“type”和包含 RestAPI 编码键的“key”。值是此对象中的当前值。

返回的字符串将用于序列化密钥。如果返回类型是列表，则这被视为分层结果听写。

请参阅此文件中的三个示例：

attribute_transformer
full_restapi_key_transformer
last_restapi_key_transformer

如果需要 XML 序列化，可以传递 kwargs is_xml=True。

as_dict(keep_readonly: bool = True, key_transformer: ~typing.Callable[[str, ~typing.Dict[str, ~typing.Any], ~typing.Any], ~typing.Any] = <function attribute_transformer>, **kwargs: ~typing.Any) -> MutableMapping[str, Any]

参数

名称	说明
key_transformer	<xref:function> 密钥转换器函数。
keep_readonly	默认值: True

类型	说明
dict	与 dict JSON 兼容的对象

deserialize

使用 RestAPI 语法分析 str 并返回模型。

deserialize(data: Any, content_type: str | None = None) -> ModelType

参数

名称	说明
data 必需	str 使用 RestAPI 结构的 str。默认情况下为 JSON。
content_type	str 默认情况下，如果 XML，则设置 application/xml。默认值: None

类型	说明
	此模型的实例

例外

类型	说明
DeserializationError if something went wrong

enable_additional_properties_sending

enable_additional_properties_sending() -> None

from_dict

使用给定的键提取程序分析 dict 返回一个模型。

默认情况下，请考虑密钥提取程序 (rest_key_case_insensitive_extractor、attribute_key_case_insensitive_extractor和last_rest_key_case_insensitive_extractor)

from_dict(data: Any, key_extractors: Callable[[str, Dict[str, Any], Any], Any] | None = None, content_type: str | None = None) -> ModelType

参数

名称	说明
data 必需	dict 使用 RestAPI 结构的 dict
content_type	str 默认情况下，如果 XML，则设置 application/xml。默认值: None
key_extractors	默认值: None

类型	说明
	此模型的实例

例外

类型	说明
DeserializationError if something went wrong

is_xml_model

is_xml_model() -> bool

serialize

返回将从此模型发送到服务器的 JSON。

这是as_dict (full_restapi_key_transformer的别名 ，keep_readonly=False) 。