Belge Yönetim Bilgileri alındı bilgisi modeli

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
  • Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
    • Doğu ABD
    • Batı ABD2
    • Batı Avrupa
    • Orta Kuzey ABD

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işareti v3.1 (GA) mavi onay işareti v3.0 (GA)mavi onay işareti v2.1 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm:mor onay işareti v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.0mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler: mor onay işareti v4.0 (önizleme) mor onay işaretiv3.1 | Önceki sürüm: mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v2.1 | En son sürüm: mavi onay işareti v4.0 (önizleme)

Belge Zekası makbuz modeli, satış makbuzlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleriyle birleştirir. Makbuzlar, basılı ve el yazısı makbuzlar dahil olmak üzere çeşitli biçimlerde ve kalitede olabilir. API satıcı adı, satıcı telefon numarası, işlem tarihi, vergi ve işlem toplamı gibi önemli bilgileri ayıklar ve yapılandırılmış JSON verilerini döndürür.

Desteklenen makbuz türleri:

  • Termal
  • Kredi Kartı
  • Gaz
  • Otopark
  • Otel
  • Ulaşım
  • İletişim
  • Eğlence
  • Uçak
  • Eğitim
  • Eczane/Tıbbi

Alındı bilgisi veri ayıklama

Makbuz dijitalleştirmesi taranan, fotoğraflanan ve yazdırılan kopyalar da dahil olmak üzere çeşitli makbuz türlerinin kolaylaştırılmış aşağı akış işleme için dijital bir biçime dönüştürülmesidir. Örnek olarak gider yönetimi, tüketici davranışı analizi, vergi otomasyonu gibi örnekler verilebilir. OCR (Optik Karakter Tanıma) teknolojisiyle Belge Zekası'nın kullanılması, bu çeşitli makbuz biçimlerinden verileri ayıklayabilir ve yorumlayabilir. Belge Zekası işleme, dönüştürme işlemini basitleştirir, aynı zamanda gereken süreyi ve çabayı önemli ölçüde azaltarak verimli veri yönetimini ve alımı kolaylaştırır.

Document Intelligence Studio ile işlenen örnek alındı bilgisi:

Document Intelligence Studio'da işlenen örnek alındı bilgisinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek alındı bilgisi:

Form Örneği Etiketleme aracıyla işlenen örnek alındı bilgisinin ekran görüntüsü.

Dağıtım seçenekleri

Document Intelligence v4.0 (2024-07-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar
Makbuz modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Okundu
    Düzen ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-07-31-preview, 2024-02-29-preview)
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
  • PDF ve TIFF için desteklenen sayfa izni: Belge Zekası, standart katman aboneleri için 2.000 sayfaya kadar veya serbest katmanlı aboneler için yalnızca ilk iki sayfayı işleyebilir.
  • Desteklenen dosya boyutu: 50 MB'tan az; en düşük piksel 50 x 50 piksel; maksimum piksel 10.000 x 10.000 piksel.

Makbuz modeli veri ayıklama

İşlemlerin saati ve tarihi, satıcı bilgileri ve makbuzlardan elde edilen tutar toplamları da dahil olmak üzere Belge Yönetim Bilgileri'nin verileri nasıl ayıkladiğini görün. Aşağıdaki kaynaklara ihtiyacınız vardır:

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Not

Document Intelligence Studio, v3.1 ve v3.0 API'leri ve sonraki sürümlerle kullanılabilir.

  1. Document Intelligence Studio giriş sayfasında Makbuzlar'ı seçin.

  2. Örnek makbuzu analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracı

  1. Belge Yönetim Bilgileri Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli analiz sonuçları işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Select-form-type açılan menüsünün ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Analiz Et ve belgeyi analiz et'i çağırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş modeller dil desteği sayfamıza bakın.

Alan ayıklama

Adı Tür Açıklama Standartlaştırılmış çıkış
ReceiptType String Satış makbuzu türü Dökümü
MerchantName String Makbuzu veren satıcının adı
MerchantPhoneNumber phoneNumber Listelenen satıcı telefon numarası +1 xxx xxx xxxx
MerchantAddress String Satıcının listelenen adresi
TransactionDate Tarih Alındı bilgisinin verildiği tarih yyyy-mm-dd
TransactionTime Saat Alındı bilgisinin verildiği zaman ss-aa-ss (24 saat)
Toplam Sayı (ABD Doları) Alış irsaliyesinin tam işlem toplamı İki ondalıklı kayan nokta
Alt Toplam Sayı (ABD Doları) Çoğunlukla vergiler uygulanmadan önce makbuzun alt toplamı İki ondalıklı kayan nokta
Vergi Sayı (ABD Doları) Makbuz üzerindeki toplam vergi (genellikle satış vergisi veya eşdeğeri). 2022-06-30 sürümünde "TotalTax" olarak yeniden adlandırıldı. İki ondalıklı kayan nokta
İpucu Sayı (ABD Doları) Alıcı tarafından dahil edilen ipucu İki ondalıklı kayan nokta
Items Nesneler dizisi Ad, miktar, birim fiyat ve ayıklanan toplam fiyat ile ayıklanan satır öğeleri
Ad String Öğe açıklaması. 2022-06-30 sürümünde "Açıklama" olarak yeniden adlandırıldı.
Miktar Sayı Her öğenin miktarı İki ondalıklı kayan nokta
Fiyat Sayı Her bir madde biriminin bireysel fiyatı İki ondalıklı kayan nokta
TotalPrice Sayı Satır öğesinin toplam fiyatı İki ondalıklı kayan nokta

Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki makbuz modeli şema sayfasına bakın.

Geçiş kılavuzu ve REST API v3.1

  • Uygulamalarınızda ve iş akışlarınızda v3.1 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.

Sonraki adımlar