LUIS에 대한 언어 및 지역 지원

Important

LUIS는 2025년 10월 1일에 사용 중지되며 2023년 4월 1일부터 새 LUIS 리소스를 만들 수 없습니다. 지속적인 제품 지원 및 다국어 기능을 활용하려면 LUIS 애플리케이션대화 언어 이해로 마이그레이션하는 것이 좋습니다.

LUIS는 서비스 내에 다양한 기능을 포함합니다. 모든 기능이 동일한 언어 패리티에 있는 것은 아닙니다. 관심 있는 기능이 사용자가 원하는 언어 문화권에서 지원되는지 확인합니다. LUIS 앱은 문화권에 따라 달라지며 설정된 후에는 변경할 수 없습니다.

다국어 LUIS 앱

챗봇과 같은 다국어 LUIS 클라이언트 애플리케이션이 필요한 경우, 몇 가지 옵션이 있습니다. LUIS가 모든 언어를 지원하는 경우 각 언어에 대한 LUIS 앱을 개발합니다. 각 LUIS 앱에는 고유한 앱 ID와 엔드포인트 로그가 있습니다. LUIS에서 지원하지 않는 언어에 대한 언어 이해를 제공해야 하는 경우 Translator 서비스를 사용하여 발화를 지원되는 언어로 번역하고, 발언을 LUIS 엔드포인트에 제출하고, 결과 점수를 받을 수 있습니다.

참고 항목

이제 최신 버전의 Language Understanding 기능이 Azure AI 언어의 일부로 제공됩니다. 자세한 내용은 Azure AI 언어 문서를 참조하세요. 언어 서비스 내에서 여러 언어를 지원하는 Language Understanding 기능은 대화 언어 이해를 참조하세요.

지원되는 언어

LUIS는 발화를 다음 언어로 이해합니다.

언어 로캘 미리 빌드된 도메인 미리 빌드된 엔터티 문구 목록 권장 사항 **감정 분석핵심 구 추출
아랍어(미리 보기 - 최신 표준 아랍어) ar-AR - - - -
*중국어 zh-CN -
네덜란드어 nl-NL - -
영어(미국) en-US
영어(영국) en-GB
프랑스어(캐나다) fr-CA - - -
프랑스어(프랑스) fr-FR
독일어 de-DE
구자라트어(미리 보기) gu-IN - - - -
힌디어(미리 보기) hi-IN - - -
이탈리아어 it-IT
*일본어 ja-JP 주요 구문만
한국어 ko-KR - - 주요 구문만
마라티어(미리 보기) mr-IN - - - -
포르투갈어(브라질) pt-BR 일부 하위 문화권은 아님
스페인어(멕시코) es-MX -
스페인어(스페인) es-ES
타밀어(미리 보기) ta-IN - - - -
텔루구어(미리 보기) te-IN - - - -
터키어 tr-TR - 감정만

언어 지원은 미리 빌드된 엔터티미리 빌드된 도메인에 따라 다릅니다.

*중국어 지원 참고

  • zh-CN 문화권에서 LUIS는 기존 문자 집합 대신 중국어 간체 문자 집합을 예상합니다.
  • 의도, 엔터티, 기능 및 정규식의 이름은 중국어 또는 로마 문자일 수 있습니다.
  • zh-CN 문화권에서 지원되는 미리 빌드된 도메인에 대한 정보는 미리 빌드된 도메인 참조를 참조하세요.

*일본어 지원 참고

  • LUIS는 구문 분석을 제공하지 않으며 Keigo와 비공식 일본어 간의 차이를 이해하지 못하므로 다양한 수준의 형식을 애플리케이션에 대한 교육 예제로 통합해야 합니다.
    • ででざいます은 です와 동일하지 않습니다.
    • です은 で와 동일하지 않습니다.

**언어 서비스 지원 참고 사항

언어 서비스에는 keyPhrase 미리 빌드된 엔터티 및 감정 분석이 포함됩니다. 하위 문화권에는 포르투갈어만 지원됩니다. pt-PTpt-BR. 다른 모든 문화권은 기본 문화권 수준에서 지원됩니다.

Speech API 지원 언어

음성 받아쓰기 모드 언어에 대한 Speech 지원 언어를 참조하세요.

Bing Spell Check 지원되는 언어

지원되는 언어 및 상태 목록은 Bing Spell Check 지원되는 언어를 참조하세요.

애플리케이션에서 드문 단어 또는 외어 단어

en-us 문화권에서 LUIS는 은어를 포함하여 대부분의 영어 단어를 구분하도록 학습됩니다. 문화권에서 zh-cn LUIS는 대부분의 중국어 문자를 구분하는 방법을 배웁니다. 드문 단어 en-us 또는 문자를 사용하고 LUIS에서 zh-cn해당 단어 또는 문자를 구분할 수 없는 것처럼 보이는 경우 해당 단어 또는 문자를 구 목록 기능에 추가할 수 있습니다. 예를 들어 애플리케이션 문화권 외부의 단어( 즉, 외문)를 구 목록 기능에 추가해야 합니다.

하이브리드 언어

하이브리드 언어는 영어 및 중국어와 같은 두 문화권의 단어를 결합합니다. 앱은 단일 문화권을 기반으로 하므로 이러한 언어는 LUIS에서 지원되지 않습니다.

토큰화

기계 학습을 수행하기 위해 LUIS는 발화를 문화권에 따라 토큰으로 나눕니다 .

언어 모든 공백 또는 특수 문자 문자 수준 복합 단어
아랍어
중국어
네덜란드어
영어(en-us)
영어(en-GB)
프랑스어(fr-FR)
프랑스어(fr-CA)
독일어
구자라트어
힌디어
이탈리아어
일본어
한국어
마라티어
포르투갈어(브라질)
스페인어(es-ES)
스페인어(es-MX)
타밀어
텔루구어
터키어

사용자 지정 토크나이저 버전

다음 문화권에는 사용자 지정 토크나이저 버전이 있습니다.

문화권 버전 목적
독일어
de-de
1.0.0 복합 단어를 단일 구성 요소로 분할하는 기계 학습 기반 토크나이저를 사용하여 단어를 분할하여 토큰화합니다.
사용자가 발화로 입력 Ich fahre einen krankenwagen 하면 발화로 전환 Ich fahre einen kranken wagen됩니다. krankenwagen을 다른 엔터티로 독립적으로 표시할 수 있습니다.
독일어
de-de
1.0.2 단어를 공백으로 분할하여 토큰화합니다.
사용자가 Ich fahre einen krankenwagen을 발화로 입력하면 단일 토큰으로 유지됩니다. 따라서 krankenwagen 단일 엔터티로 표시됩니다.
네덜란드어
nl-nl
1.0.0 복합 단어를 단일 구성 요소로 분할하는 기계 학습 기반 토크나이저를 사용하여 단어를 분할하여 토큰화합니다.
사용자가 발화로 입력 Ik ga naar de kleuterschool 하면 발화로 전환 Ik ga naar de kleuter school됩니다. kleuterschool을 다른 엔터티로 독립적으로 표시할 수 있습니다.
네덜란드어
nl-nl
1.0.1 단어를 공백으로 분할하여 토큰화합니다.
사용자가 Ik ga naar de kleuterschool을 발화로 입력하면 단일 토큰으로 유지됩니다. 따라서 kleuterschool 단일 엔터티로 표시됩니다.

tokenizer 버전 간 마이그레이션

토큰화는 앱 수준에서 발생합니다. 버전 수준 토큰화는 지원되지 않습니다.

파일을 버전 대신 새 앱으로 가져옵니다. 이 작업은 새 앱에 다른 앱 ID가 있지만 파일에 지정된 tokenizer 버전을 사용한다는 것을 의미합니다.