Belge Yönetim Bilgileri özel şablon modeli

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
  • Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
    • Doğu ABD
    • Batı ABD2
    • Batı Avrupa
    • Orta Kuzey ABD

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işareti v3.1 (GA) mavi onay işareti v3.0 (GA)mavi onay işareti v2.1 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm:mor onay işareti v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.0mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler: mor onay işareti v4.0 (önizleme) mor onay işaretiv3.1 | Önceki sürüm: mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v2.1 | En son sürüm: mavi onay işareti v4.0 (önizleme)

Özel şablon (eski adıyla özel form), etiketli anahtar-değer çiftlerini, seçim işaretlerini, tabloları, bölgeleri ve imzaları belgelerden doğru ayıklayan, eğitmek kolay bir belge modelidir. Şablon modelleri, belgelerden değerleri ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarıyla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.

Özel şablon modelleri, daha fazla alan türü ve dil desteğiyle özel sinir modelleri ile aynı etiketleme biçimini ve stratejisini paylaşır.

Model özellikleri

Özel şablon modelleri anahtar-değer çiftlerini, seçim işaretlerini, tabloları, imza alanlarını ve seçili bölgeleri destekler.

Form alanları Seçim işaretleri Tablosal alanlar (Tablolar) İmza Seçili bölgeler Çakışan alanlar
Desteklenir Desteklenir Desteklenir Desteklenir Desteklenir Desteklenmez

Tablosal alanlar

V3.0 ve sonraki API sürümlerinin yayımlanmasıyla birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler:

  • Birden çok sayfaya yayılan bir tabloyu etiketlemek için, tablonun her satırını tek bir tablodaki farklı sayfalar arasında etiketle.
  • En iyi uygulama olarak, veri kümenizin beklenen varyasyonlardan birkaç örnek içerdiğinden emin olun. Örneğin, tüm tablonun tek bir sayfada yer aldığı ve bu çeşitlemeleri belgelerde görmeyi bekliyorsanız tabloların iki veya daha fazla sayfaya yayıldığı örnekleri ekleyin.

Tablosal alanlar, tablo olarak tanınmayan bir belge içinde yinelenen bilgileri ayıklarken de yararlıdır. Örneğin, özgeçmişteki iş deneyimlerinin yinelenen bir bölümü tablosal alan olarak etiketlenebilir ve ayıklanabilir.

Çeşitlemelerle ilgilenme

Şablon modelleri tanımlı bir görsel şablonu kullanır, şablonda yapılan değişiklikler daha düşük doğrulukla sonuçlanabilir. Bu örneklerde, eğitim veri kümenizi her şablondan en az beş örnek içerecek şekilde bölün ve varyasyonların her biri için bir model eğitin. Ardından modelleri tek bir uç noktada oluşturabilirsiniz . Dijital PDF belgeleri ve görüntüleri gibi ince çeşitlemeler için, aynı eğitim veri kümesinde her tür için en az beş örnek eklemek en iyisidir.

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Görüntü:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview veya üzeri)
    Genel Belge
    Önceden oluşturulmuş
    Özel

    ✱ Microsoft Office dosyaları şu anda diğer modeller veya sürümler için desteklenmiyor.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8-point metnine karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

  • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

  • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

Model eğitma

Özel şablon modelleri genel olarak v2.0 API ve sonraki sürümlerden itibaren kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Belge Makine Zekası Stüdyosu

v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildMode template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Özel şablon modelleri genellikle v3.1 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Belge Makine Zekası Stüdyosu

v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildMode template.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için Dil Desteği— özel modeller sayfamıza bakın.

Özel (şablon) modelleri genel olarak v2.1 API'siyle kullanılabilir.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel model (şablon) Belge Yönetim Bilgileri 2.1 Belge Yönetim Bilgileri SDK'sı Belge Yönetim Bilgileri Örneği etiketleme aracı

Sonraki adımlar

Özel modeller oluşturmayı ve oluşturmayı öğrenin: