AnalyzeTextOptions 클래스
해당 텍스트를 토큰으로 분리하는 데 사용되는 일부 텍스트 및 분석 구성 요소를 지정합니다.
Azure로 보내려면 모든 필수 매개 변수를 채워야 합니다.
- 상속
-
azure.search.documents.indexes._generated._serialization.ModelAnalyzeTextOptions
생성자
AnalyzeTextOptions(**kwargs)
변수
Name | Description |
---|---|
text
|
필수 사항입니다. 토큰으로 나누기 위한 텍스트입니다. |
analyzer_name
|
지정된 텍스트를 중단하는 데 사용할 분석기의 이름입니다. 이 매개 변수를 지정하지 않으면 대신 토큰라이저를 지정해야 합니다. 토큰라이저 및 분석기 매개 변수는 상호 배타적입니다. 가능한 값은 다음과 같습니다. "ar.microsoft", "ar.lucene", "hy.lucene", "bn.microsoft", "eu.lucene", "bg.microsoft", "bg.lucene", "ca.microsoft", "ca.lucene", "zh- Hans.microsoft", "zh-Hans.lucene", "zh-Hant.microsoft", "zh-Hant.lucene", "hr.microsoft", "cs.microsoft", "cs.lucene", "cs.lucene", "da.microsoft", "da.lucene", "nl.microsoft", "nl.lucene", "en.microsoft", "en.lucene", "et.microsoft", "fi.microsoft", "fi.lucene", "fr.microsoft", "fr.lucene", "gl.lucene", "de.microsoft", "de.lucene", " el.microsoft", "el.lucene", "gu.microsoft", "he.microsoft", "hi.microsoft", "hi.lucene", "hu.microsoft", "hu.lucene", "is.microsoft", "id.microsoft", "id.lucene", "ga.lucene", "it.microsoft", "it.lucene", "ja.microsoft", "ja.lucene", "kn.microsoft", "kn.microsoft", "ko.microsoft", "ko.lucene", "lv.microsoft", "lv.lucene", "lt.microsoft", "ml.microsoft", "ms.microsoft", "mr.microsoft", "nb.microsoft", "no.lucene", "fa.lucene", "pl.microsoft", "pl.lucene", "pt-BR.microsoft", "pt-BR.lucene", "pt- PT.microsoft", "pt-PT.lucene", "pa.microsoft", "ro.microsoft", "ro.lucene", "ru.microsoft", "ru.lucene", "sr-cyrillic.microsoft", "sr-latin.microsoft", "sk.microsoft", "sl.microsoft", "es.microsoft", "es.lucene", "sv.microsoft", "sv.lucene", "ta.microsoft", "te.microsoft", "th.microsoft", "th.lucene", "tr.microsoft", "tr.lucene", "uk.microsoft", "your.microsoft", "vi.microsoft", "standard.lucene", "standardasciifolding.lucene", "키워드(keyword)", "pattern", "simple", "stop", "whitespace". |
tokenizer_name
|
지정된 텍스트를 중단하는 데 사용할 토큰라이저의 이름입니다. 이 매개 변수를 지정하지 않으면 대신 분석기를 지정해야 합니다. 토큰라이저 및 분석기 매개 변수는 상호 배타적입니다. 가능한 값은 "classic", "edgeNGram", "keyword_v2", "letter", "lowercase", "microsoft_language_tokenizer", "microsoft_language_stemming_tokenizer", "nGram", "path_hierarchy_v2", "pattern", "standard_v2", "uax_url_email", "공백"입니다. |
token_filters
|
지정된 텍스트를 끊을 때 사용할 토큰 필터의 선택적 목록입니다. 이 매개 변수는 tokenizer 매개 변수를 사용하는 경우에만 설정할 수 있습니다. |
char_filters
|
지정된 텍스트를 분리할 때 사용할 문자 필터의 선택적 목록입니다. 이 매개 변수는 tokenizer 매개 변수를 사용하는 경우에만 설정할 수 있습니다. |
메서드
as_dict |
json.dump를 사용하여 serialize할 수 있는 dict를 반환합니다. 고급 사용은 필요에 따라 콜백을 매개 변수로 사용할 수 있습니다. 키는 Python에서 사용되는 특성 이름입니다. Attr_desc 메타데이터의 받아쓰기입니다. 현재 msrest 형식의 'type'과 RestAPI로 인코딩된 키가 있는 'key'가 포함되어 있습니다. Value는 이 개체의 현재 값입니다. 반환된 문자열은 키를 serialize하는 데 사용됩니다. 반환 형식이 목록인 경우 계층적 결과 받아쓰기로 간주됩니다. 이 파일의 세 가지 예제를 참조하세요.
XML serialization을 원하는 경우 kwargs is_xml=True를 전달할 수 있습니다. |
deserialize |
RestAPI 구문을 사용하여 str을 구문 분석하고 모델을 반환합니다. |
enable_additional_properties_sending | |
from_dict |
지정된 키 추출기를 사용하여 받아쓰기를 구문 분석하여 모델을 반환합니다. 기본적으로 키 추출기(rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor 및 last_rest_key_case_insensitive_extractor)를 고려합니다. |
is_xml_model | |
serialize |
이 모델에서 서버로 보낼 JSON을 반환합니다. 이는 as_dict(full_restapi_key_transformer, keep_readonly=False)에 대한 별칭입니다. XML serialization을 원하는 경우 kwargs is_xml=True를 전달할 수 있습니다. |
as_dict
json.dump를 사용하여 serialize할 수 있는 dict를 반환합니다.
고급 사용은 필요에 따라 콜백을 매개 변수로 사용할 수 있습니다.
키는 Python에서 사용되는 특성 이름입니다. Attr_desc 메타데이터의 받아쓰기입니다. 현재 msrest 형식의 'type'과 RestAPI로 인코딩된 키가 있는 'key'가 포함되어 있습니다. Value는 이 개체의 현재 값입니다.
반환된 문자열은 키를 serialize하는 데 사용됩니다. 반환 형식이 목록인 경우 계층적 결과 받아쓰기로 간주됩니다.
이 파일의 세 가지 예제를 참조하세요.
attribute_transformer
full_restapi_key_transformer
last_restapi_key_transformer
XML serialization을 원하는 경우 kwargs is_xml=True를 전달할 수 있습니다.
as_dict(keep_readonly: bool = True, key_transformer: ~typing.Callable[[str, ~typing.Dict[str, ~typing.Any], ~typing.Any], ~typing.Any] = <function attribute_transformer>, **kwargs: ~typing.Any) -> MutableMapping[str, Any]
매개 변수
Name | Description |
---|---|
key_transformer
|
<xref:function>
키 변환기 함수입니다. |
keep_readonly
|
기본값: True
|
반환
형식 | Description |
---|---|
dict JSON 호환 개체 |
deserialize
RestAPI 구문을 사용하여 str을 구문 분석하고 모델을 반환합니다.
deserialize(data: Any, content_type: str | None = None) -> ModelType
매개 변수
Name | Description |
---|---|
data
필수
|
RestAPI 구조를 사용하는 str입니다. 기본적으로 JSON입니다. |
content_type
|
기본적으로 JSON은 XML인 경우 application/xml을 설정합니다. 기본값: None
|
반환
형식 | Description |
---|---|
이 모델의 instance |
예외
형식 | Description |
---|---|
DeserializationError if something went wrong
|
enable_additional_properties_sending
enable_additional_properties_sending() -> None
from_dict
지정된 키 추출기를 사용하여 받아쓰기를 구문 분석하여 모델을 반환합니다.
기본적으로 키 추출기(rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor 및 last_rest_key_case_insensitive_extractor)를 고려합니다.
from_dict(data: Any, key_extractors: Callable[[str, Dict[str, Any], Any], Any] | None = None, content_type: str | None = None) -> ModelType
매개 변수
Name | Description |
---|---|
data
필수
|
RestAPI 구조를 사용하는 받아쓰기 |
content_type
|
기본적으로 JSON은 XML인 경우 application/xml을 설정합니다. 기본값: None
|
key_extractors
|
기본값: None
|
반환
형식 | Description |
---|---|
이 모델의 instance |
예외
형식 | Description |
---|---|
DeserializationError if something went wrong
|
is_xml_model
is_xml_model() -> bool
serialize
이 모델에서 서버로 보낼 JSON을 반환합니다.
이는 as_dict(full_restapi_key_transformer, keep_readonly=False)에 대한 별칭입니다.
XML serialization을 원하는 경우 kwargs is_xml=True를 전달할 수 있습니다.
serialize(keep_readonly: bool = False, **kwargs: Any) -> MutableMapping[str, Any]
매개 변수
Name | Description |
---|---|
keep_readonly
|
읽기 전용 특성을 직렬화하려는 경우 기본값: False
|
반환
형식 | Description |
---|---|
dict JSON 호환 개체 |
Azure SDK for Python