FormPage 클래스
입력 문서에서 인식되는 페이지를 나타냅니다. 선, 단어, 선택 표시, 테이블 및 페이지 메타데이터를 포함합니다.
버전 v2.1의 새로운 기능: selection_marks 속성, to_dict 및 from_dict 메서드 지원
- 상속
-
builtins.objectFormPage
생성자
FormPage(**kwargs: Any)
메서드
from_dict |
FormPage 셰이프의 받아쓰기를 모델 자체로 변환합니다. |
to_dict |
FormPage의 받아쓰기 표현을 반환합니다. |
from_dict
FormPage 셰이프의 받아쓰기를 모델 자체로 변환합니다.
from_dict(data: Dict) -> FormPage
매개 변수
반환
FormPage
반환 형식
to_dict
특성
height
이미지/PDF의 높이(각각 픽셀/인치)입니다.
height: float
lines
include_field_elements true로 설정되면 인식된 텍스트 줄 목록이 반환됩니다. 콘텐츠를 인식하는 호출의 경우 이 목록은 항상 채워집니다. 반환되는 최대 줄 수는 페이지당 300개입니다. 특정 경우에는 근접이 더 높은 우선 순위로 처리되지만 선은 위에서 아래로, 왼쪽에서 오른쪽으로 정렬됩니다. 정렬 순서는 검색된 텍스트에 따라 달라지으므로 이미지 및 OCR 버전 업데이트 간에 변경될 수 있습니다. 따라서 비즈니스 논리는 주문이 아닌 실제 라인 위치를 기반으로 구축되어야 합니다. 줄의 읽기 순서는 reading_order 키워드(keyword) 인수로 지정할 수 있습니다(참고: begin_recognize_content및 begin_recognize_content_from_url 지원되는 reading_order).
lines: List[FormLine]
page_number
이 콘텐츠가 있는 페이지의 1 기반 번호입니다.
page_number: int
selection_marks
페이지에서 추출된 선택 표시 목록입니다.
selection_marks: List[FormSelectionMark]
tables
페이지에 포함된 추출된 테이블 목록입니다.
tables: List[FormTable]
text_angle
(-180, 180] 사이의 각도로 측정된 시계 방향으로 텍스트의 일반 방향입니다.
text_angle: float
unit
LengthUnit 너비, 높이 및 경계 상자 속성에 사용되는 입니다. 이미지의 경우 단위는 "pixel"입니다. PDF의 경우 단위는 "인치"입니다.
unit: str
width
이미지/PDF의 너비(각각 픽셀/인치)입니다.
width: float
Azure SDK for Python