Belge Yönetim Bilgileri özel şablon modeli
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürümler: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0 v2.1
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1 | Önceki sürüm: v2.1
Bu içerik şunlar için geçerlidir: v2.1 | En son sürüm: v4.0 (önizleme)
Özel şablon (eski adıyla özel form), etiketli anahtar-değer çiftlerini, seçim işaretlerini, tabloları, bölgeleri ve imzaları belgelerden doğru ayıklayan, eğitmek kolay bir belge modelidir. Şablon modelleri, belgelerden değerleri ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarıyla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.
Özel şablon modelleri, daha fazla alan türü ve dil desteğiyle özel sinir modelleri ile aynı etiketleme biçimini ve stratejisini paylaşır.
Model özellikleri
Özel şablon modelleri anahtar-değer çiftlerini, seçim işaretlerini, tabloları, imza alanlarını ve seçili bölgeleri destekler.
Form alanları | Seçim işaretleri | Tablosal alanlar (Tablolar) | İmza | Seçili bölgeler | Çakışan alanlar |
---|---|---|---|---|---|
Desteklenir | Desteklenir | Desteklenir | Desteklenir | Desteklenir | Desteklenmez |
Tablosal alanlar
V3.0 ve sonraki API sürümlerinin yayımlanmasıyla birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler:
- Birden çok sayfaya yayılan bir tabloyu etiketlemek için, tablonun her satırını tek bir tablodaki farklı sayfalar arasında etiketle.
- En iyi uygulama olarak, veri kümenizin beklenen varyasyonlardan birkaç örnek içerdiğinden emin olun. Örneğin, tüm tablonun tek bir sayfada yer aldığı ve bu çeşitlemeleri belgelerde görmeyi bekliyorsanız tabloların iki veya daha fazla sayfaya yayıldığı örnekleri ekleyin.
Tablosal alanlar, tablo olarak tanınmayan bir belge içinde yinelenen bilgileri ayıklarken de yararlıdır. Örneğin, özgeçmişteki iş deneyimlerinin yinelenen bir bölümü tablosal alan olarak etiketlenebilir ve ayıklanabilir.
Çeşitlemelerle ilgilenme
Şablon modelleri tanımlı bir görsel şablonu kullanır, şablonda yapılan değişiklikler daha düşük doğrulukla sonuçlanabilir. Bu örneklerde, eğitim veri kümenizi her şablondan en az beş örnek içerecek şekilde bölün ve varyasyonların her biri için bir model eğitin. Ardından modelleri tek bir uç noktada oluşturabilirsiniz . Dijital PDF belgeleri ve görüntüleri gibi ince çeşitlemeler için, aynı eğitim veri kümesinde her tür için en az beş örnek eklemek en iyisidir.
Giriş gereksinimleri
En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
Desteklenen dosya biçimleri:
Model PDF Görüntü:
JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview veya üzeri) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ✔ ✔ ✱ Microsoft Office dosyaları şu anda diğer modeller veya sürümler için desteklenmiyor.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (
DPI
) olan yaklaşık8
-point metnine karşılık gelir.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.
Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır
1GB
.
Model eğitma
Özel şablon modelleri genel olarak v2.0 API ve sonraki sürümlerden itibaren kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.
Model | REST API | SDK | Modelleri Etiketleme ve Test Et |
---|---|---|---|
Özel şablon | v3.1 API | Belge Yönetim Bilgileri SDK'sı | Belge Makine Zekası Stüdyosu |
v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode
bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildMode
template
.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Özel şablon modelleri genellikle v3.1 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.
Model | REST API | SDK | Modelleri Etiketleme ve Test Et |
---|---|---|---|
Özel şablon | v3.1 API | Belge Yönetim Bilgileri SDK'sı | Belge Makine Zekası Stüdyosu |
v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode
bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildMode
template
.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Desteklenen diller ve yerel ayarlar
Desteklenen dillerin tam listesi için Dil Desteği— özel modeller sayfamıza bakın.
Özel (şablon) modelleri genel olarak v2.1 API'siyle kullanılabilir.
Model | REST API | SDK | Modelleri Etiketleme ve Test Et |
---|---|---|---|
Özel model (şablon) | Belge Yönetim Bilgileri 2.1 | Belge Yönetim Bilgileri SDK'sı | Belge Yönetim Bilgileri Örneği etiketleme aracı |
Sonraki adımlar
Özel modeller oluşturmayı ve oluşturmayı öğrenin: