Belge Zekası eklenti özellikleri

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
  • Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
    • Doğu ABD
    • Batı ABD2
    • Batı Avrupa
    • Orta Kuzey ABD

Bu içerik şunlar için geçerlidir: Checkmark v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.1 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm: mor onay işareti v4.0 (önizleme)

Not

Eklenti özellikleri Kartvizit modeli dışındaki tüm modellerde kullanılabilir.

Özellikler

Belge Zekası daha gelişmiş ve modüler analiz özelliklerini destekler. Sonuçları belgelerinizden ayıklanan daha fazla özellik içerecek şekilde genişletmek için eklenti özelliklerini kullanın. Bazı eklenti özellikleri ek ücrete tabidir. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. Bir özelliği etkinleştirmek için ilişkili özellik adını sorgu dizesi özelliğine features ekleyin. Bir istekte, virgülle ayrılmış bir özellik listesi sağlayarak birden fazla eklenti özelliğini etkinleştirebilirsiniz. Aşağıdaki eklenti özellikleri ve sonraki sürümler için 2023-07-31 (GA) kullanılabilir.

Sürüm ve sonraki sürümler için 2024-07-31-preview Okuma modeli aranabilir PDF çıkışını destekler:

Not

  • Tüm eklenti özellikleri tüm modeller tarafından desteklenmez. Daha fazla bilgi için bkz. model veri ayıklama.

  • Eklenti özellikleri şu anda Microsoft Office dosya türleri için desteklenmemektedir.

Belge Yönetim Bilgileri, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilen ve devre dışı bırakılabilir isteğe bağlı özellikleri destekler. ve sonraki sürümler için 2023-10-31-previewaşağıdaki eklenti özellikleri kullanılabilir:

Not

2023-10-30-preview API'sindeki sorgu alanları uygulaması, son önizleme sürümünden farklıdır. Yeni uygulama daha ucuzdur ve yapılandırılmış belgelerle iyi çalışır.

Sürüm kullanılabilirliği

Eklenti Özelliği Eklenti/Ücretsiz 2024-02-29-önizleme 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ yok yok
Formül ayıklama Eklenti ✔️ ✔️ yok yok
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ yok yok
Barkod ayıklama Ücretsiz ✔️ ✔️ yok yok
Dil algılama Ücretsiz ✔️ ✔️ yok yok
Anahtar değer çiftleri Ücretsiz ✔️ yok yok yok
Sorgu alanları Eklenti* ✔️ yok yok yok

✱ Eklenti - Sorgu alanları diğer eklenti özelliklerinden farklı fiyatlendirilir. Ayrıntılar için fiyatlandırmaya bakın.

Desteklenen dosya biçimleri

  • PDF

  • Görüntüler: JPEG/JPG, PNG, BMP, TIFF, HEIF

✱ Microsoft Office dosyaları şu anda desteklenmiyor.

Yüksek çözünürlüklü ayıklama

Mühendislik çizimleri gibi büyük boyutlu belgelerden küçük metinleri tanıma görevi zor bir görevdir. Genellikle metin diğer grafik öğelerle karıştırılır ve çeşitli yazı tipleri, boyutları ve yönlendirmeleri vardır. Ayrıca, metin ayrı parçalara ayrılabilir veya diğer simgelerle bağlanabilir. Belge Zekası artık bu tür belgelerden içerik ayıklama özelliğini ocr.highResolution destekliyor. Bu eklenti özelliğini etkinleştirerek A1/A2/A3 belgelerinden geliştirilmiş içerik ayıklama kalitesi elde edersiniz.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution

Formül ayıklama

Bu ocr.formula özellik, matematik denklemleri gibi tanımlanan tüm formülleri altında bir üst düzey nesne contentolarak koleksiyonda formulas ayıklar. içinde contentalgılanan formüller olarak :formula:temsil edilir. Bu koleksiyondaki her girdi, veya displayolarak inline formül türünü ve koordinatlarıyla birlikte LaTeX gösterimini value polygon içeren bir formülü temsil eder. Başlangıçta, formüller her sayfanın sonunda görünür.

Not

Puan confidence sabit kodlanmış.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas

Yazı tipi özelliği ayıklama

özelliği, ocr.font koleksiyonda styles ayıklanan metnin tüm yazı tipi özelliklerini altında contenten üst düzey nesne olarak ayıklar. Her stil nesnesi tek bir yazı tipi özelliğini, uygulandığı metin aralığını ve buna karşılık gelen güvenilirlik puanını belirtir. Varolan stil özelliği, metnin yazı tipi, italik ve normal gibi stiller, fontStyle kalın veya normalcolor, fontWeight metnin rengi ve backgroundColor metin sınırlayıcı kutusunun rengi gibi daha fazla yazı tipi özelliğiyle similarFontFamily genişletilir.

  {your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
  {your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont

Barkod özelliği ayıklama

Bu özellik koleksiyondaki ocr.barcode barcodes tüm tanımlanan barkodları altında contenten üst düzey nesne olarak ayıklar. contentiçinde algılanan barkodlar olarak :barcode:temsil edilir. Bu koleksiyondaki her giriş bir barkodu temsil eder ve koordinatlarıyla birlikte polygon olarak kind barkod türünü ve ekli barkod içeriğini value içerir. Başlangıçta, her sayfanın sonunda barkodlar görünür. confidence için 1 olarak sabit kodlanmıştır.

Desteklenen barkod türleri

Barkod Türü Örnek
QR Code QR Kodunun ekran görüntüsü.
Code 39 Kod 39'un ekran görüntüsü.
Code 93 Kod 93'ün ekran görüntüsü.
Code 128 Kod 128'in ekran görüntüsü.
UPC (UPC-A & UPC-E) UPC'nin ekran görüntüsü.
PDF417 PDF417'nin ekran görüntüsü.
EAN-8 Avrupa makale numarası barkod ean-8'in ekran görüntüsü.
EAN-13 Avrupa makale numarası barkod ean-13'ün ekran görüntüsü.
Codabar Codabar'ın ekran görüntüsü.
Databar Veri çubuğunun ekran görüntüsü.
Databar Genişletilmiş Genişletilmiş Veri çubuğunun ekran görüntüsü.
ITF Beşte ikisi arası barkodun (ITF) ekran görüntüsü.
Data Matrix Veri Matrisi'nin ekran görüntüsü.
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes

Dil algılama

languages özelliği analyzeResult isteğe eklendiğinde, altındaki analyzeResultkoleksiyonda ile confidence birlikte her metin satırı için algılanan birincil dil tahmininde bulunurlanguages.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages

Aranabilir PDF

Aranabilir PDF özelliği, taranmış resim PDF dosyaları gibi bir analog PDF'yi eklenmiş metin içeren bir PDF'ye dönüştürmenizi sağlar. Ekli metin, algılanan metin varlıklarını görüntü dosyalarının üzerine katmanlayarak PDF'nin ayıklanan içeriğinde derin metin araması sağlar.

Önemli

  • Şu anda, aranabilir PDF özelliği yalnızca Okuma OCR modeli prebuilt-readtarafından desteklenir. Bu özelliği kullanırken, diğer model türleri bu önizleme sürümü için hata döndüreceği için değerini olarak prebuilt-readbelirtinmodelId.
  • Aranabilir PDF, genel PDF tüketimi için kullanım maliyeti olmadan 2024-07-31-preview prebuilt-read modeline dahildir.

Aranabilir PDF kullanma

Aranabilir PDF'yi kullanmak için işlemi kullanarak bir POST istekte bulunup Analyze çıkış biçimini olarak pdfbelirtin:


POST /documentModels/prebuilt-read:analyze?output=pdf
{...}
202

Analyze İşlem tamamlandıktan sonra, işlem sonuçlarını almak için bir GET istekte bulunabilirsinizAnalyze.

Başarıyla tamamlandıktan sonra PDF olarak alınabilir ve indirilebilir application/pdf. Bu işlem, Base64 ile kodlanmış JSON yerine PDF'nin eklenmiş metin biçiminin doğrudan indirilmesini sağlar.


// Monitor the operation until completion.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}
200
{...}

// Upon successful completion, retrieve the PDF as application/pdf.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}/pdf
200 OK
Content-Type: application/pdf

Anahtar-değer Çiftleri

Önceki API sürümlerinde model, prebuilt-document formlardan ve belgelerden anahtar-değer çiftlerini ayıklamıştı. Özelliğin keyValuePairs önceden oluşturulmuş düzene eklenmesiyle, düzen modeli artık aynı sonuçları üretir.

Anahtar-değer çiftleri, belge içinde bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Yapılandırılmış bir formda, bu çiftler etiket ve kullanıcının bu alan için girdiği değer olabilir. Yapılandırılmamış bir belgede, bir paragraftaki metne göre sözleşmenin yürütülme tarihi olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri, belgede yer alan metinlerin yayılma alanlarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs

Sorgu Alanları

Sorgu alanları, önceden oluşturulmuş herhangi bir modelden ayıklanan şemayı genişletmeye veya anahtar adı değişken olduğunda belirli bir anahtar adı tanımlamaya yönelik bir eklenti özelliğidir. Sorgu alanlarını kullanmak için özellikleri queryFields olarak ayarlayın ve özelliğindeki queryFields alan adlarının virgülle ayrılmış bir listesini sağlayın.

  • Belge Zekası artık sorgu alanı ayıklamalarını destekliyor. Sorgu alanı ayıklama ile, ek eğitime gerek kalmadan bir sorgu isteği kullanarak ayıklama işlemine alanlar ekleyebilirsiniz.

  • Önceden oluşturulmuş veya özel bir modelin şemasını genişletmeniz veya düzenin çıkışıyla birkaç alan ayıklamanız gerektiğinde sorgu alanlarını kullanın.

  • Sorgu alanları premium eklenti özelliğidir. En iyi sonuçları elde etmek için, çok sözcüklü alan adları için deve büyük/küçük harf veya Pascal büyük/küçük harf alan adlarını kullanarak ayıklamak istediğiniz alanları tanımlayın.

  • Sorgu alanları istek başına en fazla 20 alanı destekler. Belge alan için bir değer içeriyorsa, alan ve değer döndürülür.

  • Bu sürüm, önceki uygulamadan daha düşük fiyatlı ve doğrulanması gereken sorgu alanları özelliğinin yeni bir uygulamasına sahiptir.

Not

Document Intelligence Studio sorgu alanı ayıklama şu anda Düzen ve Önceden Oluşturulmuş modeller 2024-02-29-preview 2023-10-31-preview API'siyle ve modeller (W2, 1098 ve 1099s modelleri) dışında US tax sonraki sürümlerde kullanılabilir.

Sorgu alanı ayıklama

Sorgu alanı ayıklama için, ayıklamak istediğiniz alanları belirtin ve Belge Yönetim Bilgileri belgeyi uygun şekilde analiz eder. Bir örnek aşağıda verilmiştir:

  • Document Intelligence Studio'da bir sözleşmeyi işliyorsanız veya 2023-10-31-preview sürümlerini kullanın2024-02-29-preview:

    Document Intelligence Studio'daki sorgu alanları düğmesinin ekran görüntüsü.

  • İsteğin bir parçası olarak , , Party2, TermsOfUsePaymentTerms, , PaymentDateve TermEndDate gibi Party1alan etiketlerinin analyze document listesini geçirebilirsiniz.

    Document Intelligence Studio'da sorgu alanları seçim penceresinin ekran görüntüsü.

  • Belge Zekası, alan verilerini analiz edip ayıklayabilir ve yapılandırılmış bir JSON çıkışındaki değerleri döndürebildi.

  • Sorgu alanlarına ek olarak, yanıt metin, tablo, seçim işareti ve diğer ilgili verileri içerir.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS

Sonraki adımlar

Daha fazla bilgi edinin: Model Düzeni modelini okuma

SDK örnekleri: python

Daha fazla örnek bulun: Eklenti özellikleri

Daha fazla örnek bulun: Eklenti özellikleri