MicrosoftLanguageTokenizer Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Divide o texto usando regras específicas de idioma.
public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageTokenizer = class
inherit LexicalTokenizer
Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer
- Herança
Construtores
MicrosoftLanguageTokenizer(String) |
Inicializa uma nova instância do MicrosoftLanguageTokenizer. |
Propriedades
IsSearchTokenizer |
Um valor que indica como o tokenizer é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false. |
Language |
O idioma a ser usado. O padrão é inglês. |
MaxTokenLength |
O comprimento máximo do token. Tokens maiores do que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255. |
Name |
O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres. (Herdado de LexicalTokenizer) |