문서 인텔리전스로 구성된 사용자 지정 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다. 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-07-31-preview입니다.
  • 공개 미리 보기 버전 2024-07-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다. AI Studio의 사용자 지정 생성(문서 필드 추출) 모델은 미국 중북부 지역에서만 사용할 수 있습니다.
    • 미국 동부
    • 미국 서부2
    • 서유럽
    • 미국 중북부

이 콘텐츠의 적용 대상: 확인 표시 v4.0(미리 보기) | 이전 버전: 파란색 확인 표시 v3.1(GA) 파란색 확인 표시 v3.0(GA) 파란색 확인 표시 v2.1(GA)

이 콘텐츠의 적용 대상: 확인 표시 v3.1(GA) | 최신 버전: 보라색 확인 표시 v4.0(미리 보기) | 이전 버전: 파란색 확인 표시 v3.0 파란색 확인 표시 v2.1

이 콘텐츠의 적용 대상: 확인 표시 v3.0(GA) | 최신 버전: 보라색 확인 표시 v4.0(미리 보기) 보라색 확인 표시 v3.1 | 이전 버전: 파란색 확인 표시 v2.1

이 콘텐츠의 적용 대상: 확인 표시 v2.1 | 최신 버전:파란색 확인 표시 v4.0(미리 보기)

Important

model compose 작업 동작이 api-version=2024-07-31-preview에서 변경됩니다. model compose 작업 v4.0 이상에서는 분석을 위한 암시적 분류자 대신 명시적으로 학습된 분류자를 추가합니다. 이전에 구성된 모델 버전의 경우, 구성된 사용자 지정 모델 3.1을 참조하세요. 현재 구성된 모델을 사용하고 있다면 최신 구현으로 업그레이드하는 것이 좋습니다.

구성형 모델이란?

구성된 모델을 선택하면 단일 모델 ID로 호출된 구성된 모델에 여러 사용자 지정 모델의 그룹을 지정할 수 있습니다. 예를 들어 구성형 모델은 물자, 장비 및 가구 구매 주문을 분석하도록 학습된 사용자 지정 모델을 포함할 수 있습니다. 적절한 모델을 수동으로 선택하는 대신, 구성형 모델을 사용하여 각 분석 및 추출에 적합한 사용자 지정 모델을 결정할 수 있습니다.

일부 시나리오에서는 먼저 문서를 분류한 다음 모델에서 필드를 추출하는 데 가장 적합한 모델을 사용하여 문서를 분석해야 합니다. 이러한 시나리오에는 사용자가 문서를 업로드하지만 문서 종류가 명시적으로 알려지지 않은 시나리오가 포함될 수 있습니다. 또 다른 시나리오로는 여러 문서를 단일 파일로 함께 스캔하고 처리를 위해 파일을 제출하는 경우입니다. 그런 다음 애플리케이션은 구성 요소 문서를 식별하고 각 문서에 가장 적합한 모델을 선택해야 합니다.

이전 버전에서는 model compose 작업을 통해 암시적 분류를 수행하여 제출된 문서를 가장 잘 나타내는 사용자 지정 모델을 결정했습니다. model compose 작업의 2024-07-31-preview 구현은 이전 버전의 암시적 분류를 명시적 분류 단계로 바꾸고 조건부 라우팅을 추가합니다.

새 모델 작성 작업의 이점

새로운 model compose 작업을 수행하려면 명시적 분류자 학습이 필요하며 여러 가지 이점을 제공합니다.

  • 지속적인 증분 개선. 더 많은 샘플을 추가하고 점진적으로 분류를 개선하여 분류자의 품질을 지속적으로 향상시킬 수 있습니다. 이와 같은 미세한 조정을 통해 문서는 항상 올바른 모델로 라우팅하여 추출할 수 있습니다.

  • 라우팅 완전하게 제어. 신뢰도 기반 라우팅을 추가하여 문서 종류 및 분류 응답에 대한 신뢰도 임계값을 제공합니다.

  • 작업중 문서별 문서 종류 무시. model compose 작업의 이전 구현에서는 가장 높은 신뢰도 점수가 상대적으로 낮은 경우에도 신뢰도 점수를 기반으로 추출에 가장 적합한 분석 모델을 선택했습니다. 신뢰도 임계값을 제공하거나 또는 알려진 문서 종류를 분류에서 추출 모델로 명시적으로 매핑하지 않음으로써 특정 문서 종류를 무시할 수 있습니다.

  • 동일한 문서 종류의 여러 인스턴스 분석. 분류자의 splitMode 옵션과 페어링되는 경우, model compose 작업은 파일에서 동일한 문서의 여러 인스턴스를 검색하고 파일을 분할하여 각 문서를 독립적으로 처리할 수 있습니다. splitMode를 사용하면 단일 요청으로 문서의 여러 인스턴스를 처리할 수 있습니다.

  • 추가 기능 지원. 쿼리 필드 또는 바코드와 같은 추가 기능도 분석 모델 매개 변수의 일부로 지정할 수도 있습니다.

  • 할당된 사용자 지정 모델 최대값이 500으로 확장. 새로운 model compose 작업의 구현을 사용하면 최대 500개의 학습된 사용자 지정 모델을 단일 구성된 모델에 할당할 수 있습니다.

모델 구성을 사용하는 방법

  • 먼저 추출하거나 무시해야 하는 정보가 포함된 샘플을 포함하여 필요한 모든 문서의 샘플을 수집하는 것부터 시작합니다.

  • 폴더 이름이 구성된 모델 정의에서 사용하려는 문서 종류인 폴더에 문서를 구성하여 분류자를 학습합니다.

  • 마지막으로 사용하려는 각 문서 종류의 추출 모델을 학습합니다.

  • 분류 및 추출 모델이 학습되면 문서 인텔리전스 스튜디오, 클라이언트 라이브러리 또는 REST API를 사용하여 분류 및 추출 모델을 구성된 모델로 구성할 수 있습니다.

splitMode 매개 변수를 사용하여 파일 분할 동작을 제어합니다.

  • 없음. 전체 파일이 단일 문서로 처리됩니다.
  • perPage. 파일의 각 페이지가 별도의 문서로 처리됩니다.
  • auto. 파일이 자동으로 문서로 분할됩니다.

청구 및 가격 책정

구성된 모델에는 개별 사용자 지정 모델과 동일하게 비용이 청구됩니다. 가격은 다운스트림 분석 모델에서 분석한 페이지 수를 기준으로 책정합니다. 청구는 추출 모델로 라우팅된 페이지의 추출 가격을 기준으로 합니다. 명시적 분류 요금이 추가되면 입력 파일의 모든 페이지를 분류하는 데 비용이 발생합니다. 자세한 내용은 문서 인텔리전스 가격 책정 페이지를 참조하세요.

모델 작성 작업 사용

  • 먼저 단일 모델로 구성하려는 모든 모델 ID 목록을 만듭니다.

  • Studio, REST API 또는 클라이언트 라이브러리를 사용하여 모델을 단일 모델 ID로 구성합니다.

  • 구성된 모델 ID를 사용하여 문서를 분석합니다.

결제

구성된 모델에는 개별 사용자 지정 모델과 동일하게 비용이 청구됩니다. 가격은 분석된 페이지 수를 기준으로 책정됩니다. 청구는 추출 모델로 라우팅된 페이지의 추출 가격을 기준으로 합니다. 자세한 내용은 문서 인텔리전스 가격 책정 페이지를 참조하세요.

  • 개별 사용자 정의 모델 또는 구성된 사용자 정의 모델을 사용하여 문서를 분석하는 경우 가격은 변경되지 않습니다.

구성된 모델 기능

  • Custom templatecustom neural 모델을 여러 API 버전에서 단일 구성 모델로 함께 구성할 수 있습니다.

  • 응답에는 문서 분석을 위해 사용된 구성형 모델을 나타내는 docType 속성이 포함됩니다.

  • custom template 모델의 경우 사용자 지정 템플릿의 변형 또는 다른 양식 유형을 사용해서 구성된 모델을 만들 수 있습니다. 이 작업은 들어오는 양식이 여러 템플릿 중 하나에 속할 수 있을 때 유용합니다.

  • custom neural 모델의 경우 단일 문서 형식의 다양한 변형을 단일 학습 데이터 세트에 추가하고 사용자 지정 신경망 모델을 학습하는 것이 가장 좋습니다. model compose 작업은 분석을 위해 제출되는 다양한 형식의 문서가 있는 시나리오에 가장 적합합니다.

모델 제한 구성

  • model compose 작업을 사용하면 단일 모델 ID에 최대 500개의 모델을 할당할 수 있습니다. 작성하려는 모델 수가 구성된 모델의 상한을 초과하는 경우 다음 대안 중 하나를 사용할 수 있습니다.

  • 구성된 모델을 사용하여 문서를 분석하는 것은 단일 모델을 사용하여 문서를 분석하는 것과 동일합니다. Analyze Document 결과는 문서를 분석하기 위해 선택한 구성 요소 모델을 나타내는 docType 속성을 반환합니다.

  • 현재 model compose 작업은 레이블을 사용하여 학습된 사용자 지정 모델에만 사용할 수 있습니다.

구성형 모델 호환성

사용자 지정 모델 유형 v2.1 및 v2.0으로 학습된 모델 사용자 지정 템플릿 및 인공신경망 모델 v3.1 및 v3.0 사용자 지정 템플릿 및 인공신경망 모델 v4.0 미리 보기 사용자 지정 생성 모델 v4.0 미리 보기
버전 2.1 및 v2.0으로 학습된 모델 지원되지 않음 지원되지 않음 지원되지 않음 지원되지 않음
사용자 지정 템플릿 및 인공신경망 모델 v3.0 및 v3.1 지원되지 않음 지원됨 지원됨 지원되지 않음
사용자 지정 템플릿 및 인공신경망 모델 v4.0 미리 보기 지원되지 않음 지원됨 지원됨 지원되지 않음
사용자 지정 생성 모델 v4.0 미리 보기 지원되지 않음 지원되지 않음 지원되지 않음 지원되지 않음
  • API의 이전 버전(v2.1 이하)으로 학습된 모델을 구성하려면 동일한 레이블이 지정된 데이터 세트를 사용해서 v3.0 API로 모델을 학습합니다. 이렇게 추가하면 v2.1 모델을 다른 모델과 함께 구성할 수 있습니다.

  • API의 v2.1을 사용하여 구성된 모델은 계속 지원되며 업데이트가 필요하지 않습니다.

개발 옵션

문서 인텔리전스 v4.0:2024-07-31-preview는 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능 리소스
사용자 지정 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
구성형 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

문서 인텔리전스 v3.1:2023-07-31(GA)는 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
사용자 지정 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
구성형 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

문서 인텔리전스 v3.0:2022-08-31(GA)는 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스
사용자 지정 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
구성형 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

문서 인텔리전스 v2.1은 다음 리소스를 지원합니다.

기능 리소스
사용자 지정 모델 문서 인텔리전스 레이블 지정 도구
REST API
클라이언트 라이브러리 SDK
문서 인텔리전스 Docker 컨테이너
구성형 모델 문서 인텔리전스 레이블 지정 도구
REST API
C# SDK
Java SDK
• JavaScript SDK
Python SDK

다음 단계

사용자 지정 모델을 만들고 구성하는 방법을 알아봅니다.