AnalyzeTextOptions Classe
Specifica alcuni componenti di testo e analisi usati per suddividere il testo in token.
Tutti i parametri obbligatori devono essere popolati per inviare ad Azure.
- Ereditarietà
-
azure.search.documents.indexes._generated._serialization.ModelAnalyzeTextOptions
Costruttore
AnalyzeTextOptions(**kwargs)
Variabili
Nome | Descrizione |
---|---|
text
|
Obbligatorio. Testo da suddividere in token. |
analyzer_name
|
str oppure
LexicalAnalyzerName
Nome dell'analizzatore da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un tokenizer. I parametri del tokenizzatore e dell'analizzatore si escludono a vicenda. I valori possibili includono: "ar.microsoft", "ar.lucene", "hy.lucene", "bn.microsoft", "eu.lucene", "bg.microsoft", "bg.lucene", "ca.lucene", "ca.lucene", "zh- Hans.microsoft", "zh-Hans.lucene", "zh-Hant.microsoft", "zh-Hant.lucene", "hr .microsoft", "cs.microsoft", "cs.lucene", "da.microsoft", "da.lucene", "nl.microsoft", "nl.lucene", "en.lucene", "en.lucene", "et.microsoft", "fi.microsoft", "fi.lucene", "fr.lucene", "fr.lucene", "gl.lucene", "de.lucene", "de.lucene", " el.microsoft, "el.lucene", "gu.microsoft", "he.microsoft", "hi.microsoft", "hi.lucene", "hu.microsoft", "hu.lucene", "is.microsoft", "id.microsoft", "id.lucene", "ga.lucene", "it.lucene", "it.lucene", "ja.lucene", "kn.microsoft", "kn.microsoft", "ko.microsoft, "ko.lucene", "lv.microsoft", "lv.lucene", "lt.microsoft", "ml.microsoft", "ms.microsoft", "mr.microsoft", "nb.microsoft", "no.lucene", "fa.lucene", "pl.lucene", "pl.lucene", "pt-BR.microsoft", "pt-BR.lucene", "pt- PT.microsoft, "pt-PT.lucene", "pa.microsoft", "ro.microsoft", "ro.lucene", "ru.lucene", "ru.lucene", "sr-cyrillic.microsoft", "sr-latin.microsoft", "sk.microsoft", "sl.microsoft", "es.microsoft", "es.lucene", "sv.microsoft" sv.lucene, "ta.microsoft", "te.microsoft", "th.microsoft", "th.lucene", "tr.lucene", "tr.lucene", "uk.microsoft", "your.microsoft", "vi.microsoft", "standard.lucene", "standardasciifolding.lucene", "keyword", "pattern", "simple", "stop", " whitespace". |
tokenizer_name
|
str oppure
LexicalTokenizerName
Nome del tokenizer da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un analizzatore. I parametri del tokenizzatore e dell'analizzatore si escludono a vicenda. I valori possibili includono: "classic", "edgeNGram", "keyword_v2", "letter", "minuscola", "microsoft_language_tokenizer", "microsoft_language_stemming_tokenizer", "nGram", "path_hierarchy_v2", "pattern", "standard_v2", "uax_url_email", "whitespace". |
token_filters
|
Elenco facoltativo dei filtri token da usare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro del tokenizer. |
char_filters
|
Elenco facoltativo di filtri di caratteri da usare durante l'interruzione del testo specificato. Questo parametro può essere impostato solo quando si usa il parametro del tokenizer. |
Metodi
as_dict |
Restituisce un dict che può essere serializzato usando json.dump. L'utilizzo avanzato potrebbe facoltativamente usare un callback come parametro: La chiave è il nome dell'attributo usato in Python. Attr_desc è un dict di metadati. Attualmente contiene 'type' con il tipo msrest e 'key' con la chiave con codifica RestAPI. Il valore è il valore corrente in questo oggetto. La stringa restituita verrà usata per serializzare la chiave. Se il tipo restituito è un elenco, viene considerato un risultato gerarchico. Vedere i tre esempi in questo file:
Se si vuole la serializzazione XML, è possibile passare i kwargs is_xml=True. |
deserialize |
Analizzare uno str usando la sintassi RestAPI e restituire un modello. |
enable_additional_properties_sending | |
from_dict |
Analizzare un dict usando un estrattore chiave specificato restituisce un modello. Per impostazione predefinita, considerare gli estrattori di chiavi (rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor e last_rest_key_case_insensitive_extractor) |
is_xml_model | |
serialize |
Restituire il codice JSON che verrà inviato al server da questo modello. Si tratta di un alias per as_dict(full_restapi_key_transformer, keep_readonly=False).This is an alias to as_dict(full_restapi_key_transformer, keep_readonly=False).This is an alias to as_dict(full_restapi_key_transformer, keep_readonly=False). Se si vuole la serializzazione XML, è possibile passare i kwargs is_xml=True. |
as_dict
Restituisce un dict che può essere serializzato usando json.dump.
L'utilizzo avanzato potrebbe facoltativamente usare un callback come parametro:
La chiave è il nome dell'attributo usato in Python. Attr_desc è un dict di metadati. Attualmente contiene 'type' con il tipo msrest e 'key' con la chiave con codifica RestAPI. Il valore è il valore corrente in questo oggetto.
La stringa restituita verrà usata per serializzare la chiave. Se il tipo restituito è un elenco, viene considerato un risultato gerarchico.
Vedere i tre esempi in questo file:
attribute_transformer
full_restapi_key_transformer
last_restapi_key_transformer
Se si vuole la serializzazione XML, è possibile passare i kwargs is_xml=True.
as_dict(keep_readonly: bool = True, key_transformer: ~typing.Callable[[str, ~typing.Dict[str, ~typing.Any], ~typing.Any], ~typing.Any] = <function attribute_transformer>, **kwargs: ~typing.Any) -> MutableMapping[str, Any]
Parametri
Nome | Descrizione |
---|---|
key_transformer
|
<xref:function>
Funzione di trasformatore chiave. |
keep_readonly
|
valore predefinito: True
|
Restituisce
Tipo | Descrizione |
---|---|
Oggetto compatibile con JSON dict |
deserialize
Analizzare uno str usando la sintassi RestAPI e restituire un modello.
deserialize(data: Any, content_type: str | None = None) -> ModelType
Parametri
Nome | Descrizione |
---|---|
data
Necessario
|
Str usando la struttura RestAPI. JSON per impostazione predefinita. |
content_type
|
JSON per impostazione predefinita, impostare application/xml se XML. valore predefinito: None
|
Restituisce
Tipo | Descrizione |
---|---|
Istanza di questo modello |
Eccezioni
Tipo | Descrizione |
---|---|
DeserializationError if something went wrong
|
enable_additional_properties_sending
enable_additional_properties_sending() -> None
from_dict
Analizzare un dict usando un estrattore chiave specificato restituisce un modello.
Per impostazione predefinita, considerare gli estrattori di chiavi (rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor e last_rest_key_case_insensitive_extractor)
from_dict(data: Any, key_extractors: Callable[[str, Dict[str, Any], Any], Any] | None = None, content_type: str | None = None) -> ModelType
Parametri
Nome | Descrizione |
---|---|
data
Necessario
|
Dict using RestAPI structure |
content_type
|
JSON per impostazione predefinita, impostare application/xml se XML. valore predefinito: None
|
key_extractors
|
valore predefinito: None
|
Restituisce
Tipo | Descrizione |
---|---|
Istanza di questo modello |
Eccezioni
Tipo | Descrizione |
---|---|
DeserializationError if something went wrong
|
is_xml_model
is_xml_model() -> bool
serialize
Restituire il codice JSON che verrà inviato al server da questo modello.
Si tratta di un alias per as_dict(full_restapi_key_transformer, keep_readonly=False).This is an alias to as_dict(full_restapi_key_transformer, keep_readonly=False).This is an alias to as_dict(full_restapi_key_transformer, keep_readonly=False).
Se si vuole la serializzazione XML, è possibile passare i kwargs is_xml=True.
serialize(keep_readonly: bool = False, **kwargs: Any) -> MutableMapping[str, Any]
Parametri
Nome | Descrizione |
---|---|
keep_readonly
|
Se si vuole serializzare gli attributi readonly valore predefinito: False
|
Restituisce
Tipo | Descrizione |
---|---|
Oggetto compatibile con JSON dict |
Azure SDK for Python