DocumentPage Sınıf

Girişin bir sayfasından ayıklanan içerik ve düzen öğeleri.

Sürüm 2023-07-31'de yeni eklendi: Barkodlar ve formül özellikleri .

Devralma
builtins.object
DocumentPage

Oluşturucu

DocumentPage(**kwargs: Any)

Yöntemler

from_dict

DocumentPage şeklindeki bir dikteyi modelin kendisine dönüştürür.

to_dict

DocumentPage'in dikte gösterimini döndürür.

from_dict

DocumentPage şeklindeki bir dikteyi modelin kendisine dönüştürür.

from_dict(data: Dict) -> DocumentPage

Parametreler

data
dict
Gerekli

DocumentPage şeklinde bir sözlük.

Döndürülenler

Documentpage

Dönüş türü

to_dict

DocumentPage'in dikte gösterimini döndürür.

to_dict() -> Dict

Döndürülenler

dict

Dönüş türü

Öznitelikler

angle

İçeriğin saat yönündeki genel yönü, (-180, 180] arasında derece cinsinden ölçülür.

angle: float | None

barcodes

Sayfadan ayıklanan barkodlar.

barcodes: List[DocumentBarcode]

formulas

Sayfadan ayıklanan formüller

formulas: List[DocumentFormula]

height

Resmin/PDF'nin piksel/inç cinsinden yüksekliği.

height: float | None

lines

Hem metin hem de görsel öğeler içeren, sayfadan ayıklanan satırlar.

lines: List[DocumentLine]

page_number

Giriş belgesinde 1 tabanlı sayfa numarası.

page_number: int

selection_marks

Sayfadan ayıklanan seçim işaretleri.

selection_marks: List[DocumentSelectionMark]

spans

Sayfanın okuma sırası birleştirilmiş içerikteki konumu.

spans: List[DocumentSpan]

unit

Genişlik, yükseklik ve sınırlayıcı çokgen özellikleri tarafından kullanılan birim. Görüntüler için birim "piksel"dir. PDF için birim "inç"tir. Olası değerler şunlardır: "piksel", "inç".

unit: str | None

width

Resmin/PDF'nin genişliği sırasıyla piksel/inç cinsindendir.

width: float | None

words

Sayfadan ayıklanan sözcükler.

words: List[DocumentWord]