Document Classifiers - Get Classify Result
Ruft das Ergebnis des Dokumentklassifizierers ab.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-07-31-preview
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
classifier
|
path | True |
string |
Eindeutiger Dokumentklassifizierername. RegEx-Muster: |
endpoint
|
path | True |
string uri |
Der Document Intelligence-Dienstendpunkt. |
result
|
path | True |
string uuid |
Analysieren Sie die Ergebnis-ID des Vorgangs. |
api-version
|
query | True |
string |
Die API-Version, die für diesen Vorgang verwendet werden soll. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
Die Anforderung ist erfolgreich. |
|
Other Status Codes |
Unerwartete Fehlerantwort. |
Sicherheit
Ocp-Apim-Subscription-Key
Typ:
apiKey
In:
header
OAuth2Auth
Typ:
oauth2
Ablauf:
accessCode
Autorisierungs-URL:
https://login.microsoftonline.com/common/oauth2/authorize
Token-URL:
https://login.microsoftonline.com/common/oauth2/token
Bereiche
Name | Beschreibung |
---|---|
https://cognitiveservices.azure.com/.default |
Beispiele
Get Classify Document Result
Beispielanforderung
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-07-31-preview
Beispiel für eine Antwort
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-07-31-preview",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
Definitionen
Name | Beschreibung |
---|---|
Address |
Adressfeldwert. |
Analyze |
Ergebnis der Dokumentanalyse. |
Analyze |
Status und Ergebnis des Analysevorgangs. |
Bounding |
Umgebendes Polygon auf einer bestimmten Seite der Eingabe. |
Content |
Format des Inhalts im analysierten Ergebnis. |
Currency |
Währungsfeldwert. |
Document |
Ein Objekt, das die Position und den semantischen Inhalt eines Dokuments beschreibt. |
Document |
Ein Barcodeobjekt. |
Document |
Barcodeart. |
Document |
Ein Beschriftungsobjekt, das eine Tabelle oder Abbildung beschreibt. |
Document |
Ein Objekt, das den Inhalt und die Position eines Feldwerts darstellt. |
Document |
Semantischer Datentyp des Feldwerts. |
Document |
Ein Objekt, das eine Abbildung im Dokument darstellt. |
Document |
Ein Fußnotenobjekt, das eine Tabelle oder Abbildung beschreibt. |
Document |
Ein Formelobjekt. |
Document |
Formeltyp. |
Document |
Ein Objekt, das den Feldschlüssel oder -wert in einem Schlüssel-Wert-Paar darstellt. |
Document |
Ein Objekt, das ein Formularfeld mit eindeutiger Feldbeschriftung (Schlüssel) und Feldwert darstellt (kann leer sein). |
Document |
Ein Objekt, das die erkannte Sprache für einen bestimmten Textbereich darstellt. |
Document |
Ein Inhaltszeilenobjekt, das aus einer angrenzenden Abfolge von Inhaltselementen besteht, z. B. Wörter und Auswahlzeichen. |
Document |
Inhalt und Layoutelemente, die aus einer Seite aus der Eingabe extrahiert wurden. |
Document |
Ein Absatzobjekt, das in der Regel mit zusammenhängenden Linien besteht, mit allgemeiner Ausrichtung und Abständen. |
Document |
Ein Objekt, das einen Abschnitt im Dokument darstellt. |
Document |
Ein Auswahlmarkierungsobjekt, das Kontrollkästchen, Optionsfelder und andere Elemente darstellt, die eine Auswahl angeben. |
Document |
Status des Auswahlzeichens. |
Document |
Vorhandensein einer Signatur. |
Document |
Zusammenhängender Bereich der verketteten Inhaltseigenschaft, angegeben als Offset und Länge. |
Document |
Ein Objekt, das beobachtete Textformatvorlagen darstellt. |
Document |
Ein Tabellenobjekt, das tabellenzellen besteht, die in einem rechteckigen Layout angeordnet sind. |
Document |
Ein Objekt, das die Position und den Inhalt einer Tabellenzelle darstellt. |
Document |
Tabellenzellentyp. |
Document |
Ein Wortobjekt, das aus einer zusammenhängenden Abfolge von Zeichen besteht. Bei nicht leerzeichentrennten Sprachen, z. B. Chinesisch, Japanisch und Koreanisch, wird jedes Zeichen als eigenes Wort dargestellt. |
Error |
Das Fehlerobjekt. |
Error |
Fehlerantwortobjekt. |
Font |
Schriftschnitt. |
Font |
Schriftbreite. |
Inner |
Ein Objekt, das spezifischere Informationen zum Fehler enthält. |
Length |
Die Einheit, die von den Eigenschaften Breite, Höhe und Polygon verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "inch". |
Operation |
Vorgangsstatus. |
Paragraph |
Semantische Rolle des Absatzes. |
String |
Methode zum Berechnen des Zeichenfolgenoffsets und der Länge. |
Warning |
Das Fehlerobjekt. |
AddressValue
Adressfeldwert.
Name | Typ | Beschreibung |
---|---|---|
city |
string |
Name der Stadt, Stadt, Dorf usw. |
cityDistrict |
string |
Bezirke oder Bezirke in einer Stadt, z. B. Brooklyn in New York City oder City of Enumeration in London. |
countryRegion |
string |
Land/Region. |
house |
string |
Buildname, z. B. World Trade Center. |
houseNumber |
string |
Haus- oder Gebäudenummer. |
level |
string |
Bodennummer, z. B. 3F. |
poBox |
string |
Post office box number. |
postalCode |
string |
Postleitzahl, die für die E-Mail-Sortierung verwendet wird. |
road |
string |
Straßenname. |
state |
string |
Verwaltungsabteilung der ersten Ebene. |
stateDistrict |
string |
Verwaltungsabteilung der zweiten Ebene, die in bestimmten Gebietsschemas verwendet wird. |
streetAddress |
string |
Adresse auf Straßenebene, ausgenommen Stadt, Bundesland, LandRegion und Postleitzahl. |
suburb |
string |
Inoffizieller Nachbarschaftsname, wie Chinatown. |
unit |
string |
Wohnung oder Büronummer |
AnalyzeResult
Ergebnis der Dokumentanalyse.
Name | Typ | Beschreibung |
---|---|---|
apiVersion |
string |
API-Version, die verwendet wird, um dieses Ergebnis zu erzeugen. |
content |
string |
Verketten Sie die Zeichenfolgendarstellung aller Text- und visuellen Elemente in lesereihenfolge. |
contentFormat |
Format des Inhalts auf oberster Ebene des Analyseergebnisses. |
|
documents |
Document[] |
Extrahierte Dokumente. |
figures |
Extrahierte Zahlen. |
|
keyValuePairs |
Extrahierte Schlüssel-Wert-Paare. |
|
languages |
Erkannte Sprachen. |
|
modelId |
string |
Dokumentmodell-ID, die verwendet wird, um dieses Ergebnis zu erzeugen. |
pages |
Analysierte Seiten. |
|
paragraphs |
Extrahierte Absätze. |
|
sections |
Extrahierte Abschnitte. |
|
stringIndexType |
Methode zum Berechnen des Zeichenfolgenoffsets und der Länge. |
|
styles |
Extrahierte Schriftformate. |
|
tables |
Extrahierte Tabellen. |
|
warnings |
Warning[] |
Liste der aufgetretenen Warnungen. |
AnalyzeResultOperation
Status und Ergebnis des Analysevorgangs.
Name | Typ | Beschreibung |
---|---|---|
analyzeResult |
Ergebnis der Dokumentanalyse. |
|
createdDateTime |
string |
Datum und Uhrzeit (UTC), wann der Analysevorgang übermittelt wurde. |
error |
Fehler während der Dokumentanalyse. |
|
lastUpdatedDateTime |
string |
Datum und Uhrzeit (UTC), wann der Status zuletzt aktualisiert wurde. |
status |
Vorgangsstatus. notStarted, running, succeeded, or failed |
BoundingRegion
Umgebendes Polygon auf einer bestimmten Seite der Eingabe.
Name | Typ | Beschreibung |
---|---|---|
pageNumber |
integer |
1-basierte Seitenzahl der Seite, die den umgebenden Bereich enthält. |
polygon |
number[] |
Umgebendes Polygon auf der Seite oder die gesamte Seite, falls nicht angegeben. Koordinaten, die relativ zur oberen linken Seite der Seite angegeben werden. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
ContentFormat
Format des Inhalts im analysierten Ergebnis.
Name | Typ | Beschreibung |
---|---|---|
markdown |
string |
Markdowndarstellung des Dokumentinhalts mit Abschnittsüberschriften, Tabellen usw. |
text |
string |
Nur-Text-Darstellung des Dokumentinhalts ohne Formatierung. |
CurrencyValue
Währungsfeldwert.
Name | Typ | Beschreibung |
---|---|---|
amount |
number |
Währungsbetrag. |
currencyCode |
string |
Aufgelöster Währungscode (ISO 4217), falls vorhanden. |
currencySymbol |
string |
Währungssymbolbezeichnung, falls vorhanden. |
Document
Ein Objekt, das die Position und den semantischen Inhalt eines Dokuments beschreibt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Umgebende Bereiche, die das Dokument abdecken. |
|
confidence |
number |
Konfidenz, dass das Dokument ordnungsgemäß extrahiert wird. |
docType |
string |
Dokumenttyp. |
fields |
<string,
Document |
Wörterbuch der benannten Feldwerte. |
spans |
Speicherort des Dokuments in der Lesereihenfolge verketteter Inhalte. |
DocumentBarcode
Ein Barcodeobjekt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenz, dass der Barcode richtig extrahiert wird. |
kind |
Barcodeart. |
|
polygon |
number[] |
Umgebendes Polygon des Barcodes mit Koordinaten, die relativ zur oberen linken Ecke der Seite angegeben sind. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
span |
Speicherort des Barcodes in der Lesereihenfolge verketteter Inhalte. |
|
value |
string |
Barcodewert. |
DocumentBarcodeKind
Barcodeart.
Name | Typ | Beschreibung |
---|---|---|
Aztec |
string |
Aztec-Code gemäß definition in ISO/IEC 24778:2008. |
Codabar |
string |
Codabar-Barcode, wie in ANSI/AIM BC3-1995 definiert. |
Code128 |
string |
Code 128 Barcode, wie in ISO/IEC 15417:2007 definiert. |
Code39 |
string |
Code 39 Barcode, wie in ISO/IEC 16388:2007 definiert. |
Code93 |
string |
Code 93 Barcode, wie in ANSI/AIM BC5-1995 definiert. |
DataBar |
string |
GS1 DataBar-Barcode. |
DataBarExpanded |
string |
GS1 DataBar Expanded Barcode. |
DataMatrix |
string |
Datenmatrixcode, wie in ISO/IEC 16022:2006 definiert. |
EAN13 |
string |
GS1 13-stellige Internationale Artikelnummer (Europäische Artikelnummer). |
EAN8 |
string |
GS1 8-stellige Internationale Artikelnummer (Europäische Artikelnummer). |
ITF |
string |
Interleaved 2 of 5 barcode, as defined in ANSI/AIM BC2-1995. |
MaxiCode |
string |
MaxCode, wie in ISO/IEC 16023:2000 definiert. |
MicroQRCode |
string |
Mikro-QR-Code, wie in ISO/IEC 23941:2022 definiert. |
PDF417 |
string |
PDF417, wie in ISO 15438 definiert. |
QRCode |
string |
QR-Code, wie in ISO/IEC 18004:2015 definiert. |
UPCA |
string |
GS1 12-stelliger Universeller Produktcode. |
UPCE |
string |
GS1 6-stelliger Universeller Produktcode. |
DocumentCaption
Ein Beschriftungsobjekt, das eine Tabelle oder Abbildung beschreibt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die die Beschriftung abdecken. |
|
content |
string |
Inhalt der Beschriftung. |
elements |
string[] |
Untergeordnete Elemente der Beschriftung. |
spans |
Speicherort der Beschriftung in der Lesereihenfolge verketteter Inhalte. |
DocumentField
Ein Objekt, das den Inhalt und die Position eines Feldwerts darstellt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die das Feld abdecken. |
|
confidence |
number |
Konfidenz, dass das Feld ordnungsgemäß extrahiert wird. |
content |
string |
Feldinhalt. |
spans |
Position des Felds in der Lesereihenfolge verketteter Inhalte. |
|
type |
Datentyp des Feldwerts. |
|
valueAddress |
Adresswert. |
|
valueArray |
Array von Feldwerten. |
|
valueBoolean |
boolean |
Boolescher Wert. |
valueCountryRegion |
string |
3-Buchstaben-Ländercodewert (ISO 3166-1 alpha-3). |
valueCurrency |
Währungswert. |
|
valueDate |
string |
Datumswert im Format JJJJ-MM-DD (ISO 8601). |
valueInteger |
integer |
Ganzzahliger Wert. |
valueNumber |
number |
Gleitkommawert. |
valueObject |
<string,
Document |
Wörterbuch der benannten Feldwerte. |
valuePhoneNumber |
string |
Telefonnummernwert im E.164-Format (z. B. +19876543210). |
valueSelectionGroup |
string[] |
Auswahlgruppenwert. |
valueSelectionMark |
Auswahlzeichenwert. |
|
valueSignature |
Vorhandensein einer Signatur. |
|
valueString |
string |
Zeichenfolgenwert. |
valueTime |
string |
Zeitwert im hh:mm:ss-Format (ISO 8601). |
DocumentFieldType
Semantischer Datentyp des Feldwerts.
Name | Typ | Beschreibung |
---|---|---|
address |
string |
Analysierte Adresse. |
array |
string |
Liste der Unterfelder desselben Typs. |
boolean |
string |
Boolescher Wert, normalisiert auf "true" oder "false". |
countryRegion |
string |
Land/Region, normalisiert auf ISO 3166-1 Alpha-3-Format (z. B. USA). |
currency |
string |
Währungsbetrag mit optionalem Währungssymbol und Einheit. |
date |
string |
Datum, normalisiert auf ISO 8601 (JJJJ-MM-DD) Format. |
integer |
string |
Ganze Zahl, normalisiert auf 64-Bit-Ganzzahl mit Vorzeichen. |
number |
string |
Gleitkommazahl, normalisiert in Gleitkommazahl mit doppelter Genauigkeit. |
object |
string |
Benannte Liste von Unterfeldern potenziell unterschiedlicher Typen. |
phoneNumber |
string |
Telefonnummer, normalisiert auf E.164 (+{CountryCode}{SubscriberNumber}) Format. |
selectionGroup |
string |
Array der ausgewählten Zeichenfolgenwerte. |
selectionMark |
string |
Ist das Feld ausgewählt? |
signature |
string |
Ist die Signatur vorhanden? |
string |
string |
Klartext. |
time |
string |
Zeit, normalisiert auf ISO 8601 (hh:mm:ss)-Format. |
DocumentFigure
Ein Objekt, das eine Abbildung im Dokument darstellt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die die Abbildung abdecken. |
|
caption |
Beschriftung, die der Abbildung zugeordnet ist. |
|
elements |
string[] |
Untergeordnete Elemente der Abbildung, mit Ausnahme von Beschriftungen oder Fußnoten. |
footnotes |
Liste der Fußnoten, die der Abbildung zugeordnet sind. |
|
id |
string |
Abbildungs-ID. |
spans |
Position der Abbildung in der Lesereihenfolge verketteter Inhalte. |
DocumentFootnote
Ein Fußnotenobjekt, das eine Tabelle oder Abbildung beschreibt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die die Fußnote abdecken. |
|
content |
string |
Inhalt der Fußnote. |
elements |
string[] |
Untergeordnete Elemente der Fußnote. |
spans |
Position der Fußnote in der Lesereihenfolge verketteter Inhalte. |
DocumentFormula
Ein Formelobjekt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenz, dass die Formel ordnungsgemäß extrahiert wird. |
kind |
Formeltyp. |
|
polygon |
number[] |
Umgebendes Polygon der Formel mit Koordinaten, die relativ zur oberen linken Seite der Seite angegeben sind. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
span |
Position der Formel in der Lesereihenfolge verketteter Inhalte. |
|
value |
string |
LaTex-Ausdruck, der die Formel beschreibt. |
DocumentFormulaKind
Formeltyp.
Name | Typ | Beschreibung |
---|---|---|
display |
string |
Eine Formel im Anzeigemodus, die eine ganze Zeile einnimmt. |
inline |
string |
Eine Formel, die in den Inhalt eines Absatzes eingebettet ist. |
DocumentKeyValueElement
Ein Objekt, das den Feldschlüssel oder -wert in einem Schlüssel-Wert-Paar darstellt.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die das Schlüsselwertelement abdecken. |
|
content |
string |
Verketteter Inhalt des Schlüsselwertelements in Leserichtung. |
spans |
Speicherort des Schlüsselwertelements in der Lesereihenfolge verketteter Inhalte. |
DocumentKeyValuePair
Ein Objekt, das ein Formularfeld mit eindeutiger Feldbeschriftung (Schlüssel) und Feldwert darstellt (kann leer sein).
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenz, dass das Schlüssel-Wert-Paar ordnungsgemäß extrahiert wird. |
key |
Feldbeschriftung des Schlüsselwertpaars. |
|
value |
Feldwert des Schlüsselwertpaars. |
DocumentLanguage
Ein Objekt, das die erkannte Sprache für einen bestimmten Textbereich darstellt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Vertrauen der korrekten Identifizierung der Sprache. |
locale |
string |
Erkannte Sprache. Der Wert kann einen ISO 639-1-Sprachcode (z. B. "en", "fr") oder BCP 47-Sprachtag (z. B. "zh-Hans") aufweisen. |
spans |
Speicherort der Textelemente im verketteten Inhalt, auf den die Sprache angewendet wird. |
DocumentLine
Ein Inhaltszeilenobjekt, das aus einer angrenzenden Abfolge von Inhaltselementen besteht, z. B. Wörter und Auswahlzeichen.
Name | Typ | Beschreibung |
---|---|---|
content |
string |
Verketteter Inhalt der enthaltenen Elemente in lesereihenfolge. |
polygon |
number[] |
Umgebendes Polygon der Linie mit Koordinaten, die relativ zur oberen linken Ecke der Seite angegeben sind. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
spans |
Position der Zeile in der Lesereihenfolge verketteter Inhalte. |
DocumentPage
Inhalt und Layoutelemente, die aus einer Seite aus der Eingabe extrahiert wurden.
Name | Typ | Beschreibung |
---|---|---|
angle |
number |
Die allgemeine Ausrichtung des Inhalts im Uhrzeigersinn, gemessen in Grad zwischen (-180, 180]. |
barcodes |
Extrahierte Barcodes von der Seite. |
|
formulas |
Extrahierte Formeln von der Seite. |
|
height |
number |
Die Höhe des Bilds bzw. der PDF-Datei in Pixel/Zoll. |
lines |
Extrahierte Zeilen von der Seite, die potenziell textbezogene und visuelle Elemente enthalten. |
|
pageNumber |
integer |
1-basierte Seitenzahl im Eingabedokument. |
selectionMarks |
Extrahierte Auswahlmarkierungen von der Seite. |
|
spans |
Speicherort der Seite in der Lesereihenfolge verketteter Inhalte. |
|
unit |
Die Einheit, die von den Eigenschaften Breite, Höhe und Polygon verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "inch". |
|
width |
number |
Die Breite des Bilds bzw. der PDF-Datei in Pixel/Zoll. |
words |
Extrahierte Wörter aus der Seite. |
DocumentParagraph
Ein Absatzobjekt, das in der Regel mit zusammenhängenden Linien besteht, mit allgemeiner Ausrichtung und Abständen.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die den Absatz abdecken. |
|
content |
string |
Verketteter Inhalt des Absatzes in Leserichtung. |
role |
Semantische Rolle des Absatzes. |
|
spans |
Position des Absatzes in der Lesereihenfolge verketteter Inhalte. |
DocumentSection
Ein Objekt, das einen Abschnitt im Dokument darstellt.
Name | Typ | Beschreibung |
---|---|---|
elements |
string[] |
Untergeordnete Elemente des Abschnitts. |
spans |
Speicherort des Abschnitts in der Lesereihenfolge verketteter Inhalte. |
DocumentSelectionMark
Ein Auswahlmarkierungsobjekt, das Kontrollkästchen, Optionsfelder und andere Elemente darstellt, die eine Auswahl angeben.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenz, dass das Auswahlzeichen korrekt extrahiert wird. |
polygon |
number[] |
Umgebendes Polygon des Auswahlzeichens mit Koordinaten, die relativ zur oberen linken Ecke der Seite angegeben sind. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
span |
Position des Auswahlzeichens in der Lesereihenfolge verketteter Inhalte. |
|
state |
Status des Auswahlzeichens. |
DocumentSelectionMarkState
Status des Auswahlzeichens.
Name | Typ | Beschreibung |
---|---|---|
selected |
string |
Das Auswahlzeichen wird ausgewählt, häufig durch ein Häkchen oder X innerhalb des Markierungszeichens gekennzeichnet. |
unselected |
string |
Das Auswahlzeichen ist nicht ausgewählt. |
DocumentSignatureType
Vorhandensein einer Signatur.
Name | Typ | Beschreibung |
---|---|---|
signed |
string |
Eine Signatur wird erkannt. |
unsigned |
string |
Es werden keine Signaturen erkannt. |
DocumentSpan
Zusammenhängender Bereich der verketteten Inhaltseigenschaft, angegeben als Offset und Länge.
Name | Typ | Beschreibung |
---|---|---|
length |
integer |
Die Anzahl der Zeichen im Inhalt, der durch den Bereich dargestellt wird. |
offset |
integer |
Nullbasierter Index des Inhalts, der durch die Spanne dargestellt wird. |
DocumentStyle
Ein Objekt, das beobachtete Textformatvorlagen darstellt.
Name | Typ | Beschreibung |
---|---|---|
backgroundColor |
string |
Hintergrundfarbe im hexadezimalen Format #rrggbb. |
color |
string |
Vordergrundfarbe im #rrggbb Hexadezimalformat. |
confidence |
number |
Vertrauen der korrekten Identifizierung des Stils. |
fontStyle |
Schriftschnitt. |
|
fontWeight |
Schriftbreite. |
|
isHandwritten |
boolean |
Sind Inhalte handschriftlich? |
similarFontFamily |
string |
Visuell ähnlichste Schriftart aus der Gruppe der unterstützten Schriftfamilien mit Fallbackschriftarten nach css-Konvention (z. B. 'Arial, sans-serif'). |
spans |
Die Position der Textelemente im verketteten Inhalt, auf den die Formatvorlage angewendet wird. |
DocumentTable
Ein Tabellenobjekt, das tabellenzellen besteht, die in einem rechteckigen Layout angeordnet sind.
Name | Typ | Beschreibung |
---|---|---|
boundingRegions |
Begrenzungsbereiche, die die Tabelle abdecken. |
|
caption |
Beschriftung, die der Tabelle zugeordnet ist. |
|
cells |
Zellen, die in der Tabelle enthalten sind. |
|
columnCount |
integer |
Anzahl der Spalten in der Tabelle. |
footnotes |
Liste der Fußnoten, die der Tabelle zugeordnet sind. |
|
rowCount |
integer |
Anzahl der Zeilen in der Tabelle. |
spans |
Position der Tabelle in der Lesereihenfolge verketteter Inhalte. |
DocumentTableCell
Ein Objekt, das die Position und den Inhalt einer Tabellenzelle darstellt.
Name | Typ | Standardwert | Beschreibung |
---|---|---|---|
boundingRegions |
Begrenzungsbereiche, die die Tabellenzelle abdecken. |
||
columnIndex |
integer |
Spaltenindex der Zelle. |
|
columnSpan |
integer |
1 |
Die Anzahl der Spalten, die von dieser Zelle überspannt sind. |
content |
string |
Verketteter Inhalt der Tabellenzelle in Leserichtung. |
|
elements |
string[] |
Untergeordnete Elemente der Tabellenzelle. |
|
kind | content |
Tabellenzellentyp. |
|
rowIndex |
integer |
Zeilenindex der Zelle. |
|
rowSpan |
integer |
1 |
Die Anzahl der Zeilen, die von dieser Zelle überspannt sind. |
spans |
Position der Tabellenzelle in der Lesereihenfolge verketteter Inhalte. |
DocumentTableCellKind
Tabellenzellentyp.
Name | Typ | Beschreibung |
---|---|---|
columnHeader |
string |
Beschreibt den Inhalt der Spalte. |
content |
string |
Enthält den Hauptinhalt/die Hauptdaten. |
description |
string |
Beschreibt den Inhalt in (Teilen) der Tabelle. |
rowHeader |
string |
Beschreibt den Inhalt der Zeile. |
stubHead |
string |
Beschreibt die Zeilenüberschriften, die sich normalerweise in der oberen linken Ecke einer Tabelle befinden. |
DocumentWord
Ein Wortobjekt, das aus einer zusammenhängenden Abfolge von Zeichen besteht. Bei nicht leerzeichentrennten Sprachen, z. B. Chinesisch, Japanisch und Koreanisch, wird jedes Zeichen als eigenes Wort dargestellt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenz, dass das Wort richtig extrahiert wird. |
content |
string |
Textinhalt des Worts. |
polygon |
number[] |
Umgebendes Polygon des Worts mit Koordinaten, die relativ zur oberen linken Ecke der Seite angegeben sind. Die Zahlen stellen die x-, y-Werte der Polygonvertices dar, im Uhrzeigersinn von links (-180 Grad einschließlich) relativ zur Elementausrichtung. |
span |
Position des Worts in der Lesereihenfolge verketteter Inhalte. |
Error
Das Fehlerobjekt.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
details |
Error[] |
Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben. |
innererror |
Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler. |
|
message |
string |
Eine lesbare Darstellung des Fehlers. |
target |
string |
Das Ziel des Fehlers. |
ErrorResponse
Fehlerantwortobjekt.
Name | Typ | Beschreibung |
---|---|---|
error |
Fehlerinformationen. |
FontStyle
Schriftschnitt.
Name | Typ | Beschreibung |
---|---|---|
italic |
string |
Zeichen werden visuell nach rechts geneigt. |
normal |
string |
Zeichen werden normal dargestellt. |
FontWeight
Schriftbreite.
Name | Typ | Beschreibung |
---|---|---|
bold |
string |
Zeichen werden mit dickeren Strichen dargestellt. |
normal |
string |
Zeichen werden normal dargestellt. |
InnerError
Ein Objekt, das spezifischere Informationen zum Fehler enthält.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
innererror |
Innerer Fehler. |
|
message |
string |
Eine lesbare Darstellung des Fehlers. |
LengthUnit
Die Einheit, die von den Eigenschaften Breite, Höhe und Polygon verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "inch".
Name | Typ | Beschreibung |
---|---|---|
inch |
string |
Längeneinheit für PDF-Dateien. |
pixel |
string |
Längeneinheit für Bilddateien. |
OperationStatus
Vorgangsstatus.
Name | Typ | Beschreibung |
---|---|---|
canceled |
string |
Der Vorgang wurde abgebrochen. |
completed |
string |
Der Vorgang wurde abgeschlossen. |
failed |
string |
Fehler beim Vorgang. |
notStarted |
string |
Der Vorgang wurde noch nicht gestartet. |
running |
string |
Der Vorgang wird ausgeführt. |
succeeded |
string |
Der Vorgang ist erfolgreich. |
ParagraphRole
Semantische Rolle des Absatzes.
Name | Typ | Beschreibung |
---|---|---|
footnote |
string |
Eine Notiz, die in der Regel nach dem Hauptinhalt auf einer Seite platziert wird. |
formulaBlock |
string |
Ein Formelblock, häufig mit freigegebener Ausrichtung. |
pageFooter |
string |
Text am unteren Rand der Seite. |
pageHeader |
string |
Text am oberen Rand der Seite. |
pageNumber |
string |
Seitennummer. |
sectionHeading |
string |
Unterüberschrift, die einen Abschnitt des Dokuments beschreibt. |
title |
string |
Titel der obersten Ebene, der das gesamte Dokument beschreibt. |
StringIndexType
Methode zum Berechnen des Zeichenfolgenoffsets und der Länge.
Name | Typ | Beschreibung |
---|---|---|
textElements |
string |
Vom Benutzer wahrgenommenes Anzeigezeichen oder Graphemecluster, wie durch Unicode 8.0.0 definiert. |
unicodeCodePoint |
string |
Zeicheneinheit dargestellt durch einen einzelnen Unicode-Codepunkt. Wird von Python 3 verwendet. |
utf16CodeUnit |
string |
Zeicheneinheit dargestellt durch eine 16-Bit-Unicode-Codeeinheit. Wird von JavaScript, Java und .NET verwendet. |
Warning
Das Fehlerobjekt.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Einer der serverdefinierten Warnungscodes. |
message |
string |
Eine lesbare Darstellung der Warnung. |
target |
string |
Das Ziel des Fehlers. |