Belge işleme modelleri

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
  • Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
    • Doğu ABD
    • Batı ABD2
    • Batı Avrupa
    • Orta Kuzey ABD

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işareti v3.1 (GA) mavi onay işareti v3.0 (GA)mavi onay işareti v2.1 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm:mor onay işareti v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.0mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler: mor onay işareti v4.0 (önizleme) mor onay işaretiv3.1 | Önceki sürüm: mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v2.1 | En son sürüm: mavi onay işareti v4.0 (önizleme)

Azure AI Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemenize olanak tanıyan çok çeşitli modelleri destekler. Önceden oluşturulmuş etki alanına özgü bir model kullanabilir veya özel iş ihtiyaçlarınıza ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanılabilir.

Not

  • Finansal veriler, korumalı sağlık verileri, kişisel veriler veya yüksek oranda hassas veriler içeren belge işleme projeleri dikkatli bir şekilde dikkat gerektirir.
  • Ulusal/bölgesel ve sektöre özgü tüm gereksinimlere uyladığınızdan emin olun.

Modele genel bakış

Aşağıdaki tabloda, her geçerli önizleme ve kararlı API için kullanılabilir modeller gösterilmektedir:

Model Türü Model 2024-02-29-preview
2023-10-31-preview
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Belge çözümleme modelleri Okuma ✔️ ✔️ ✔️ yok
Belge çözümleme modelleri Düzen ✔️ ✔️ ✔️ ✔️
Belge çözümleme modelleri Genel belge düzene taşındı** ✔️ ✔️ yok
Önceden oluşturulmuş modeller Banka Çeki ✔️ yok yok yok
Önceden oluşturulmuş modeller Banka Ekstresi ✔️ yok yok yok
Önceden oluşturulmuş modeller Paystub ✔️ yok yok yok
Önceden oluşturulmuş modeller Sözleşme ✔️ ✔️ yok yok
Önceden oluşturulmuş modeller Sağlık sigortası kartı ✔️ ✔️ ✔️ yok
Önceden oluşturulmuş modeller Kimlik belgesi ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Fatura ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Makbuz ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller ABD Birleşik Vergisi* ✔️ yok yok yok
Önceden oluşturulmuş modeller US 1040 Tax* ✔️ ✔️ yok yok
Önceden oluşturulmuş modeller US 1098 Tax* ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD 1099 Vergisi* ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD W2 Vergisi ✔️ ✔️ ✔️ yok
Önceden oluşturulmuş modeller ABD Mortgage 1003 URLA ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage 1004 URAR ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage 1005 ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage 1008 Özeti ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage kapanış açıklaması ✔️ yok yok yok
Önceden oluşturulmuş modeller Evlilik sertifikası ✔️ yok yok yok
Önceden oluşturulmuş modeller Kredi kartı ✔️ yok yok yok
Önceden oluşturulmuş modeller Kartvizit kullanım dışı ✔️ ✔️ ✔️
Özel sınıflandırma modeli Özel sınıflandırıcı ✔️ ✔️ yok yok
Özel Oluşturucu Model Özel Oluşturucu Model ✔️ yok yok yok
Özel ayıklama modeli Özel nöral ✔️ ✔️ ✔️ yok
Özel ifade modeli Özel şablon ✔️ ✔️ ✔️ ✔️
Özel ayıklama modeli Özel oluşturulmuş ✔️ ✔️ ✔️ ✔️
Tüm modeller Eklenti özellikleri ✔️ ✔️ yok yok

* - Alt modelleri içerir. Desteklenen çeşitlemeler ve alt türleri için modele özgü bilgilere bakın.

Gecikme süresi

Gecikme süresi, bir API sunucusunun gelen isteği işlemesi ve işlemesi ve giden yanıtı istemciye teslim etme süresidir. Belgeyi analiz etme süresi, her sayfadaki boyuta (ör. sayfa sayısı) ve ilişkili içeriğe bağlıdır. Belge Zekası, benzer belgeler için gecikme süresinin karşılaştırılabilir olduğu ancak her zaman aynı olmadığı çok kiracılı bir hizmettir. Gecikme süresi ve performansta zaman zaman değişkenlik, görüntüleri ve büyük belgeleri büyük ölçekte işleyen mikro hizmet tabanlı, durum bilgisi olmayan, zaman uyumsuz hizmetlerde geçerlidir. Donanım ve kapasite ile ölçeklendirme özelliklerini sürekli olarak artırıyor olsak da, çalışma zamanında gecikme sorunları yaşamaya devam edebilirsiniz.

Eklenti Özelliği Eklenti/Ücretsiz 2024-02-29-preview
&bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ yok yok
Formül ayıklama Eklenti ✔️ ✔️ yok yok
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ yok yok
Barkod ayıklama Ücretsiz ✔️ ✔️ yok yok
Dil algılama Ücretsiz ✔️ ✔️ yok yok
Anahtar değer çiftleri Ücretsiz ✔️ yok yok yok
Sorgu alanları Eklenti* ✔️ yok yok yok
Aranabilir pdf Eklenti* ✔️ yok yok yok

Model analizi özellikleri

Model Kimliği İçerik Ayıklama Sorgu alanları Paragraf Paragraf Rolleri Seçim İşaretleri Tablolar Anahtar-Değer Çiftleri Diller Barkodlar Belge Analizi Formül* Stil Yazı Tipi* Yüksek Çözünürlük* Aranabilir PDF
önceden oluşturulmuş okuma O O O O O
önceden oluşturulmuş düzen O O O O O
önceden oluşturulmuş belge O O O O O
önceden oluşturulmuş businessCard
önceden oluşturulmuş sözleşme O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
önceden oluşturulmuş fatura O O O O O O
önceden oluşturulmuş makbuz O O O O O
prebuilt-marriageCertificate.us O O O O O
önceden oluşturulmuş creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
önceden oluşturulmuş-mortgage.us.1004 O O O O O
önceden oluşturulmuş-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
önceden oluşturulmuş tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(çeşitlemeler) O O O O O
prebuilt-tax.us.1040(çeşitlemeler) O O O O O
{ customModelName } O O O O O

✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir

Eklenti* - Sorgu alanlarının fiyatı diğer eklenti özelliklerinden farklıdır. Ayrıntılar için fiyatlandırmaya bakın.

Sınırlayıcı kutu ve çokgen koordinatları

Sınırlayıcı kutu (polygon v3.0 ve sonraki sürümlerde), nesne algılama için başvuru noktası olarak kullanılan bir belgedeki metin öğelerini çevreleyen soyut bir dikdörtgendir.

  • Sınırlayıcı kutu, dört sayısal çiftten oluşan bir dizide sunulan x ve y koordinat düzlemi kullanılarak konumu belirtir. Her çift, kutunun bir köşesini şu sırayla temsil eder: sol üst, sağ üst, sağ alt, sol alt.

  • Görüntü koordinatları piksel cinsinden gösterilir. PDF için koordinatlar inç olarak sunulur.

Kartvizit modeli dışındaki tüm modellerde, Belge Zekası artık daha gelişmiş analizlere olanak sağlamak için eklenti özelliklerini destekliyor. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. (GA) ve sonraki API sürümü için 2023-07-31 yedi eklenti özelliği vardır:

Dil desteği

Belge Zekası'ndaki derin öğrenme tabanlı evrensel modeller, karma dillere sahip metin satırları da dahil olmak üzere resimlerinizden ve belgelerinizden çok dilli metin ayıklayan birçok dili destekler. Dil desteği, Belge Zekası hizmeti işlevselliğine göre değişir. Tam liste için aşağıdaki makalelere bakın:

Bölgesel kullanılabilirlik

Belge Zekası genel olarak 60'ın üzeri Azure genel altyapı bölgesinde kullanılabilir.

Daha fazla bilgi için, sizin ve müşterileriniz için en uygun bölgeyi seçmenize yardımcı olmak için Azure coğrafyaları sayfamıza bakın.

Model ayrıntıları

Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebilirsiniz.

OCR okuma

Okuma API'si, algılanırsa satırları, sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz eder ve ayıklar.

Document Intelligence Studio kullanılarak işlenen örnek belge:

Document Intelligence Studio Okuma kullanılarak işlenen örnek belgenin ekran görüntüsü

Düzen analizi

Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri, sayfa alt bilgileri ve daha fazlası gibi diğer yapı öğelerini analiz eder ve ayıklar.

Document Intelligence Studio kullanılarak işlenen örnek belge:

Document Intelligence Studio kullanılarak işlenen örnek gazete sayfasının ekran görüntüsü.

Sağlık sigortası kartı

Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleri ile birleştirir.

Document Intelligence Studio kullanılarak işlenen örnek ABD sağlık sigortası kartı:

Document Intelligence Studio'da örnek bir ABD sağlık sigortası kartı analizinin ekran görüntüsü.

ABD vergi belgeleri

ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:

Model Açıklama ModelKimliği
ABD Vergisi W-2 Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. prebuilt-tax.us.w2
ABD Vergisi 1040 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1040(çeşitlemeler)
ABD Vergisi 1098 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1098(çeşitlemeler)
ABD Vergisi 1099 İşveren dışındaki kaynaklardan alınan geliri ayıklayın. prebuilt-tax.us.1099(çeşitlemeler)

Document Intelligence Studio kullanılarak işlenen örnek W-2 belgesi:

Örnek W-2'nin ekran görüntüsü.

ABD ipotek belgeleri

ABD ipotek belgesi modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgileri dahil olmak üzere önemli alanları analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:

Model Açıklama ModelKimliği
1003 Son Kullanıcı Lisans Sözleşmesi (EULA) Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. prebuilt-mortgage.us.1003
1008 Özet belgesi Ödünç almacı, satıcı, mülk, ipotek ve altına yazan ayrıntıları ayıklayın. prebuilt-mortgage.us.1008
Kapanış açıklaması Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. prebuilt-mortgage.us.closingDisclosure
Evlilik sertifikası Ortak kredi başvuru sahipleri için evlilik bilgileri bilgilerini ayıklayın. önceden oluşturulmuş evlilikSertifika
ABD Vergisi W-2 Gelir doğrulaması için vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. prebuilt-tax.us.w2

Document Intelligence Studio kullanılarak işlenen Örnek Kapanış açıklama belgesi:

Örnek kapanış açıklamasının ekran görüntüsü.

Contract

Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.

Document Intelligence Studio kullanılarak işlenen örnek sözleşme:

Document Intelligence Studio kullanarak sözleşme modeli ayıklama işleminin ekran görüntüsü.

Fatura

Fatura modeli, müşteri adını, fatura adresini, son tarihi ve vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir. Model şu anda İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca, Portekizce ve Felemenkçe faturaları desteklemektedir.

Document Intelligence Studio kullanılarak işlenen örnek fatura:

Örnek faturanın ekran görüntüsü.

Makbuz

Satış makbuzlarını basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için taramak için makbuz modelini kullanın. v3.0 sürümü, tek sayfalı otel makbuzu işlemeyi de destekler.

Document Intelligence Studio kullanılarak işlenen örnek alındı bilgisi:

Örnek alındı bilgisinin ekran görüntüsü.

Kimlik belgesi (Kimlik)

Anahtar alanları ayıklamak için ABD Sürücü Lisanslarını (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan biyografik sayfaları (vize ve diğer seyahat belgeleri hariç) işlemek için Kimlik belgesi (KIMLIK) modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek ABD Sürücü Lisansı:

Örnek kimlik kartının ekran görüntüsü.

Evlilik sertifikası

Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek ABD evlilik sertifikası:

Örnek evlilik sertifikasının ekran görüntüsü.

Kredi kartı

Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek kredi kartı:

Örnek kredi kartının ekran görüntüsü.

Özel modeller

Özel modeller geniş bir şekilde iki türe sınıflandırılabilir. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.

Özel model türlerinin ve ilişkili model derleme modlarının diyagramı.

Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Bunlar, ayrı içeriğinizdeki form alanlarını tanır ve anahtar-değer çiftlerini ve tablo verilerini ayıklar. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.

Sürüm v3.0 ve üzeri özel modeller, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler. İmza algılama , belgeyi imzalayan kişinin kimliğini değil, imzanın varlığını arar. Model imza algılama için imzasız döndürürse, model tanımlı alanda imza bulamadı.

Document Intelligence Studio kullanılarak işlenen örnek özel şablon:

Belge Yönetim Bilgileri aracının özel form çözümleme penceresinin ekran görüntüsü.

Özel ayıklama

Özel ayıklama modeli, özel şablon veya özel sinir olmak üzere iki türden biri olabilir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.

Document Intelligence Studio kullanılarak işlenen örnek özel ayıklama:

Document Intelligence Studio'da özel ayıklama modeli analizinin ekran görüntüsü.

Özel sınıflandırıcı

Özel sınıflandırma modeli, ayıklama modelini çağırmadan önce belge türünü tanımlamanızı sağlar. Sınıflandırma modeli API'den 2023-07-31 (GA) başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.

Oluşturulan modeller

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.

Document Intelligence Studio'da oluşturulan model iletişim kutusu penceresi:

Document Intelligence Studio özel model oluştur iletişim penceresinin ekran görüntüsü.

Giriş gereksinimleri

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Okundu
    Düzen ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-07-31-preview, 2024-02-29-preview)
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Sürüm geçişi

Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin

Model Açıklama
Belge analizi
Düzen Belgelerden metin ve düzen bilgilerini ayıklama.
Önceden oluşturulmuş
Fatura İngilizce ve İspanyolca faturalardan önemli bilgileri ayıklayın.
Makbuz İngilizce makbuzlardan önemli bilgileri ayıklayın.
Kimlik belgesi ABD sürücü lisanslarından ve uluslararası pasaportlardan önemli bilgileri ayıklayın.
Kartvizit İngilizce kartvizitlerden önemli bilgileri ayıklayın.
Özel
Özel İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir.
Oluşan Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın.

Düzen

Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek belge:

Örnek Etiketleme aracını kullanan 'düzen' analizinin ekran görüntüsü.

Fatura

Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek fatura:

Örnek Etiketleme aracının kullanıldığı örnek fatura analizinin ekran görüntüsü.

Makbuz

  • Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek alındı bilgisi:

Örnek alındı bilgisinin ekran görüntüsü.

Kimlik belgesi

Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:

  • ABD Sürücü Lisansları (50 eyaletin tamamı ve Columbia Bölgesi)

  • Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar

Örnek Etiketleme aracı kullanılarak işlenen örnek ABD Sürücü Lisansı:

Örnek kimlik kartının ekran görüntüsü.

Kartvizit

Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek kartvizit:

Örnek kartvizitin ekran görüntüsü.

Özel

  • Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar-değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türüne yalnızca beş örnek gerekir ve özel modeliniz etiketli veri kümeleriyle veya etiketsiz olarak eğitilebilir.

Örnek Etiketleme aracını kullanarak örnek özel model işleme:

Belge Yönetim Bilgileri aracının özel form çözümleme penceresinin ekran görüntüsü.

Oluşturulan özel model

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.

Örnek Etiketleme aracını kullanarak oluşturulan model iletişim kutusu penceresi:

Document Intelligence Studio özel model oluştur iletişim penceresinin ekran görüntüsü.

Model veri ayıklama

Model Metin ayıklama Dil algılama Seçim İşaretleri Tablolar Paragraf Paragraf rolleri Anahtar-Değer çiftleri Alanlar
Düzen
Fatura
Makbuz
Kimlik Belgesi
Kartvizit
Özel Form

Giriş gereksinimleri

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Okundu
    Düzen ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-07-31-preview, 2024-02-29-preview)
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Sürüm geçişi

Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenebilirsiniz

Sonraki adımlar