CustomAnalyzer interface

텍스트를 인덱싱 가능/검색 가능한 토큰으로 변환하는 프로세스를 제어할 수 있습니다. 미리 정의된 단일 토큰라이저와 하나 이상의 필터로 구성된 사용자 정의 구성입니다. tokenizer는 텍스트를 토큰으로 분리하고 토큰 변환기에서 내보낸 토큰을 수정하기 위한 필터를 담당합니다.

속성

charFilters

토큰라이저에서 처리하기 전에 입력 텍스트를 준비하는 데 사용되는 문자 필터 목록입니다. 예를 들어, 특정 문자 또는 기호를 대신할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.

name

분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

odatatype

다형 판별자

tokenFilters

토큰화기에서 생성된 토큰을 필터링하거나 수정하는 데 사용되는 토큰 필터 목록입니다. 예를 들어, 모든 문자를 소문자로 변환하는 소문자 필터를 지정할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.

tokenizerName

연속 텍스트를 단어로 구분하는 등의 일련의 토큰으로 나누는 데 사용할 토큰라이저의 이름입니다. KnownTokenizerNames 는 기본 제공 토큰라이저 이름을 포함하는 열거형입니다.

속성 세부 정보

charFilters

토큰라이저에서 처리하기 전에 입력 텍스트를 준비하는 데 사용되는 문자 필터 목록입니다. 예를 들어, 특정 문자 또는 기호를 대신할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.

charFilters?: string[]

속성 값

string[]

name

분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

name: string

속성 값

string

odatatype

다형 판별자

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

속성 값

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

토큰화기에서 생성된 토큰을 필터링하거나 수정하는 데 사용되는 토큰 필터 목록입니다. 예를 들어, 모든 문자를 소문자로 변환하는 소문자 필터를 지정할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.

tokenFilters?: string[]

속성 값

string[]

tokenizerName

연속 텍스트를 단어로 구분하는 등의 일련의 토큰으로 나누는 데 사용할 토큰라이저의 이름입니다. KnownTokenizerNames 는 기본 제공 토큰라이저 이름을 포함하는 열거형입니다.

tokenizerName: string

속성 값

string