Analyzer - Analyze Layout

Extrahera text- och layoutinformation från ett visst dokument. Indatadokumentet måste ha någon av de innehållstyper som stöds – "application/pdf", "image/jpeg", "image/png", "image/tiff" eller "image/bmp". Du kan också använda typen "application/json" för att ange platsen (Uri eller lokal sökväg) för dokumentet som ska analyseras.

POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string

Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus2.api.cognitive.microsoft.com).

language
query

Language

För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket.

pages
query

string[]

Anpassade sidnummer för dokument med flera sidor (PDF/TIFF), anger antalet sidor som du vill få OCR-resultat. Använd ett bindestreck för ett antal sidor. Avgränsa varje sida eller intervall med kommatecken.

readingOrder
query

ReadingOrder

Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural.

Begärandehuvud

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Name Obligatorisk Typ Description
Ocp-Apim-Subscription-Key True

string

Begärandetext

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Name Typ Description
source

string

Sökväg till filkälla.

Svar

Name Typ Description
202 Accepted

Begäran har placerats i kö.

Sidhuvuden

Operation-Location: string

Other Status Codes

ErrorResponse

Svarsentitet som medföljer icke-lyckade svar som innehåller ytterligare information om felet.

Säkerhet

Ocp-Apim-Subscription-Key

Typ: apiKey
I: header

Exempel

Analyze layout

Exempelbegäran

POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en

Exempelsvar

Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f

Definitioner

Name Description
ErrorInformation
ErrorResponse
Language

För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket.

ReadingOrder

Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural.

SourcePath

Uri eller lokal sökväg till källdata.

ErrorInformation

Name Typ Description
code

string

message

string

ErrorResponse

Name Typ Description
error

ErrorInformation

Language

För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket.

Name Typ Description
af

string

ast

string

bi

string

br

string

ca

string

ceb

string

ch

string

co

string

crh

string

cs

string

csb

string

da

string

de

string

en

string

es

string

et

string

eu

string

fi

string

fil

string

fj

string

fr

string

fur

string

fy

string

ga

string

gd

string

gil

string

gl

string

gv

string

hni

string

hsb

string

ht

string

hu

string

ia

string

id

string

it

string

iu

string

ja

string

jv

string

kaa

string

kac

string

kea

string

kha

string

kl

string

ko

string

ku

string

kw

string

lb

string

ms

string

mww

string

nap

string

nl

string

no

string

oc

string

pl

string

pt

string

quc

string

rm

string

sco

string

sl

string

sq

string

sv

string

sw

string

tet

string

tr

string

tt

string

uz

string

vo

string

wae

string

yua

string

za

string

zh-Hans

string

zh-Hant

string

zu

string

ReadingOrder

Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural.

Name Typ Description
basic

string

natural

string

SourcePath

Uri eller lokal sökväg till källdata.

Name Typ Description
source

string

Sökväg till filkälla.