Analyzer - Analyze Layout
Extrahera text- och layoutinformation från ett visst dokument. Indatadokumentet måste ha någon av de innehållstyper som stöds – "application/pdf", "image/jpeg", "image/png", "image/tiff" eller "image/bmp". Du kan också använda typen "application/json" för att ange platsen (Uri eller lokal sökväg) för dokumentet som ska analyseras.
POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus2.api.cognitive.microsoft.com). |
language
|
query |
För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket. |
||
pages
|
query |
string[] |
Anpassade sidnummer för dokument med flera sidor (PDF/TIFF), anger antalet sidor som du vill få OCR-resultat. Använd ett bindestreck för ett antal sidor. Avgränsa varje sida eller intervall med kommatecken. |
|
reading
|
query |
Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural. |
Begärandehuvud
Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"
Name | Obligatorisk | Typ | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Begärandetext
Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"
Name | Typ | Description |
---|---|---|
source |
string |
Sökväg till filkälla. |
Svar
Name | Typ | Description |
---|---|---|
202 Accepted |
Begäran har placerats i kö. Sidhuvuden Operation-Location: string |
|
Other Status Codes |
Svarsentitet som medföljer icke-lyckade svar som innehåller ytterligare information om felet. |
Säkerhet
Ocp-Apim-Subscription-Key
Typ:
apiKey
I:
header
Exempel
Analyze layout
Exempelbegäran
POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en
Exempelsvar
Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f
Definitioner
Name | Description |
---|---|
Error |
|
Error |
|
Language |
För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket. |
Reading |
Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural. |
Source |
Uri eller lokal sökväg till källdata. |
ErrorInformation
Name | Typ | Description |
---|---|---|
code |
string |
|
message |
string |
ErrorResponse
Name | Typ | Description |
---|---|---|
error |
Language
För närvarande endast afrikaaner ('af'), albanska ('sq'), asturiska ('ast'), baskiska ('eu'), Bislama ('bi'), Breton ('br'), katalanska ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican ('co'), Krimtatar - Latinskt skript('crh''), Cornish ('kw'), Corsican ('co'), KrimTatar - Latinsk skrift('crh''), Cornish ('kw'), Corsican (), tjeckiska ('cs'), danska ('da'), nederländska ('nl'), engelska ('en'), estniska ('et'), fijianska ('fj'), filippinska ('fil'), finska ('fi'), franska ('fr'), friuliska ('päls'), galiciska ('gl'), tyska ('de'), Gilbertese ('gil'), Grönlandic ('kl'), Haitisk kreol ('ht'), Hani ('hni'), Hmong Daw ('mww'), ungerska ('hu'), indonesiska ('id'), Interlingua ('ia'), Inuktitut ('iu'), irish ('ga'), italienska ('it'), japanska ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), ), Kara-Kalpak ("kaa", Kashubian ("csb", Khasi ('kha'), koreansk ('ko'), kurdisk - latinsk skrift ('ku'), K'iche' ('quc'), luxemburgsk ('lb'), malajiska ('ms'), Manx ('gv'), neapolitan ('nap'), norska ('nej'), Occitan ('oc'), polska ('pl'), Portugisiska ('pt'), Romansh ('rm'), Skottar ('sco'), skotsk gaeliska ('gd'), förenklad kinesiska ('zh-Hans'), slovenska ('sl'), spanska ('es'), swahili ('sw'), svenska ('sv'), tatariska - latinsk skrift ('tt'), Tetum ('tet'), traditionell kinesiska ('zh-Hant'), turkiska ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Zhuang ('za') och Zulu ('zu') stöds (skriv ut – sjuttiotre språk och handskrivna – endast engelska). Layout har stöd för automatisk språkidentifiering och dokument med flera språk, så ange bara en språkkod om du vill tvinga den dokumenterade att bearbetas som det specifika språket.
Name | Typ | Description |
---|---|---|
af |
string |
|
ast |
string |
|
bi |
string |
|
br |
string |
|
ca |
string |
|
ceb |
string |
|
ch |
string |
|
co |
string |
|
crh |
string |
|
cs |
string |
|
csb |
string |
|
da |
string |
|
de |
string |
|
en |
string |
|
es |
string |
|
et |
string |
|
eu |
string |
|
fi |
string |
|
fil |
string |
|
fj |
string |
|
fr |
string |
|
fur |
string |
|
fy |
string |
|
ga |
string |
|
gd |
string |
|
gil |
string |
|
gl |
string |
|
gv |
string |
|
hni |
string |
|
hsb |
string |
|
ht |
string |
|
hu |
string |
|
ia |
string |
|
id |
string |
|
it |
string |
|
iu |
string |
|
ja |
string |
|
jv |
string |
|
kaa |
string |
|
kac |
string |
|
kea |
string |
|
kha |
string |
|
kl |
string |
|
ko |
string |
|
ku |
string |
|
kw |
string |
|
lb |
string |
|
ms |
string |
|
mww |
string |
|
nap |
string |
|
nl |
string |
|
no |
string |
|
oc |
string |
|
pl |
string |
|
pt |
string |
|
quc |
string |
|
rm |
string |
|
sco |
string |
|
sl |
string |
|
sq |
string |
|
sv |
string |
|
sw |
string |
|
tet |
string |
|
tr |
string |
|
tt |
string |
|
uz |
string |
|
vo |
string |
|
wae |
string |
|
yua |
string |
|
za |
string |
|
zh-Hans |
string |
|
zh-Hant |
string |
|
zu |
string |
ReadingOrder
Läsordningsalgoritmen för att sortera de returnerade textraderna. Läsordrar som stöds är: basic(default), natural.
Name | Typ | Description |
---|---|---|
basic |
string |
|
natural |
string |
SourcePath
Uri eller lokal sökväg till källdata.
Name | Typ | Description |
---|---|---|
source |
string |
Sökväg till filkälla. |