Belge Yönetim Bilgileri fatura modeli

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
  • Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
    • Doğu ABD
    • Batı ABD2
    • Batı Avrupa
    • Orta Kuzey ABD

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işareti v3.1 (GA) mavi onay işareti v3.0 (GA)mavi onay işareti v2.1 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm:mor onay işareti v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.0mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler: mor onay işareti v4.0 (önizleme) mor onay işaretiv3.1 | Önceki sürüm: mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v2.1 | En son sürüm: mavi onay işareti v4.0 (önizleme)

Belge Yönetim Bilgileri fatura modeli, satış faturalarından, yardımcı program faturalarından ve satınalma siparişlerinden önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Faturalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler gibi çeşitli biçimlerde ve kalitede olabilir. API fatura metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda 27 dilde faturaları desteklemektedir.

Desteklenen belge türleri:

  • Faturalar
  • Yardımcı program faturaları
  • Satış siparişleri
  • Satınalma siparişleri

Otomatik fatura işleme

Otomatik fatura işleme, ödeme hesabı belgelerinden anahtar accounts payable alanları ayıklama işlemidir. Ayıklanan veriler, gözden geçirmeler ve ödemeler için borç hesapları (AP) iş akışlarınızla tümleştirilmiş faturalardan gelen satır öğelerini içerir. Geçmişte, borç hesapları işlemi el ile gerçekleştirilir ve bu nedenle çok zaman alır. Anahtar verilerin faturalardan doğru şekilde ayıkılması genellikle fatura otomasyon sürecinin ilk ve en kritik adımlarından biridir.

Document Intelligence Studio ile işlenen örnek fatura:

Document Intelligence Studio'da analiz edilen örnek faturanın ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek fatura:

Örnek faturanın ekran görüntüsü.

Dağıtım seçenekleri

Document Intelligence v4.0 (2024-07-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar
Fatura modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Okundu
    Düzen ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-07-31-preview, 2024-02-29-preview)
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
  • Desteklenen PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
  • Desteklenen dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel olmalıdır.

Fatura modeli veri ayıklama

Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

  1. Document Intelligence Studio giriş sayfasında Faturalar'ı seçin.

  2. Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracı

  1. Belge Yönetim Bilgileri Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli analiz sonuçları işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    select-form-type açılan menüsünü gösteren ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Analiz Et ve belgeyi analiz et'i çağırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.

Alan ayıklama

  • Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki fatura modeli şema sayfasına bakın.

  • Ayıklanan fatura anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır documentResults .

Anahtar değer çiftleri

Önceden oluşturulmuş fatura 2022-06-30 ve üzeri sürümler anahtar-değer çiftlerinin isteğe bağlı dönüşünü destekler. Varsayılan olarak, anahtar-değer çiftlerinin dönüşü devre dışıdır. Anahtar-değer çiftleri, faturada bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Bir faturada, bu çiftler etiket ve kullanıcının bu alan veya telefon numarası için girdiği değer olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri her zaman belgede yer alan metin aralıklarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

Ayıklanan alanlar

Fatura hizmeti metin, tablo ve 26 fatura alanını ayıklar. JSON çıkış yanıtında bir faturadan ayıklanan alanlar aşağıda verilmiştir (aşağıdaki çıktıda bu örnek fatura kullanılmıştır).

Adı Tür Açıklama Metin Değer (standartlaştırılmış çıkış)
CustomerName Dize Faturalanan müşteri Microsoft Corp
CustomerId Dize Müşterinin başvuru kimliği CID-12345
PurchaseOrder Dize Satınalma siparişi başvuru numarası PO-3333
InvoiceId Dize Bu belirli faturanın kimliği (genellikle "Fatura Numarası") TERS-100
InvoiceDate tarih Faturanın düzenlendiği tarih 11/15/2019 2019-11-15
DueDate tarih Bu faturanın ödeme tarihi 15.12.2019 2019-12-15
VendorName Dize Faturayı oluşturan satıcı CONTOSO
VendorAddress Dize Satıcının posta adresi 123 456th St New York, NY, 10001
VendorAddressRecipient Dize VendorAddress ile ilişkili ad Contoso Genel Merkezi
CustomerAddress Dize Müşteri için posta adresi 123 Diğer Cadde, Redmond, Washington, 98052
CustomerAddressRecipient Dize CustomerAddress ile ilişkili ad Microsoft Corp
BillingAddress Dize Müşteri için açık faturalama adresi 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient Dize BillingAddress ile ilişkilendirilmiş ad Microsoft Hizmetleri
ShippingAddress Dize Müşteri için açık sevkiyat adresi 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient Dize ShippingAddress ile ilişkilendirilmiş ad Microsoft Teslimi
Ara toplam Numara Bu faturada tanımlanan alt toplam alanı $100,00 100
TotalTax Numara Bu faturada tanımlanan toplam vergi alanı $10,00 10
InvoiceTotal Numara Bu faturayla ilişkili toplam yeni ücretler 110,00 ABD doları 110
AmountDue Numara Satıcıdan Kaynaklanan Toplam Tutar 610,00 ABD doları 610
ServiceAddress Dize Müşteri için açık hizmet adresi veya özellik adresi 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient Dize ServiceAddress ile ilişkilendirilmiş ad Microsoft Hizmetleri
RemittanceAddress Dize Müşteri için açık havale veya ödeme adresi 123 Remit St New York, NY, 10001
RemittanceAddressRecipient Dize RemittanceAddress ile ilişkili ad Contoso Faturalama
ServiceStartDate tarih Hizmet döneminin ilk tarihi (örneğin, bir hizmet faturası hizmet dönemi) 10/14/2019 2019-10-14
ServiceEndDate tarih Hizmet döneminin bitiş tarihi (örneğin, bir yardımcı program faturası hizmet dönemi) 11/14/2019 2019-11-14
PreviousUnpaidBalance Numara Önceden ödenmemiş açık bakiye 500,00 ABD doları 500

JSON çıkış yanıtında bir faturadan ayıklanan ve bu örnek faturayı kullanan satır öğeleri aşağıda verilmişti:

Adı Tür Açıklama Metin (satır öğesi #1) Değer (standartlaştırılmış çıkış)
Items Dize Satır öğesinin tam dize metin satırı 4/3/2021 A123 Danışmanlık Hizmetleri 2 saat $30,00 10% 60,00 $
Tutar Numara Satır öğesinin miktarı 60,00 ABD doları 100
Açıklama Dize Fatura satırı öğesinin metin açıklaması Danışmanlık hizmeti Danışmanlık hizmeti
Miktar Numara Bu fatura satırı maddesinin miktarı 2 2
UnitPrice Numara Bu öğenin bir biriminin net veya brüt fiyatı (faturanın brüt fatura ayarına bağlı olarak) $30,00 30
ProductCode Dize Belirli bir satır öğesiyle ilişkili ürün kodu, ürün numarası veya SKU A123
Unit Dize Satır öğesinin birimi, örneğin kg, lb vb. saat
Tarih tarih Her satır öğesine karşılık gelen tarih. Bu genellikle satır öğesinin sevk edildiği tarihtir 3/4/2021 2021-03-04
Vergi Numara Her satır öğesiyle ilişkili vergi. Olası değerler arasında vergi tutarı, vergi % ve vergi Y/N yer alır %10

JSON çıkış yanıtında bir faturadan ayıklanan karmaşık alanlar şunlardır:

TaxDetails

Vergi ayrıntıları, fatura toplamına uygulanan belirli vergileri tanımlar.

Adı Tür Açıklama Metin (satır öğesi #1) Değer (standartlaştırılmış çıkış)
Items Dize Vergi öğesinin tam dize metin satırı V.A.T. %15 $60,00
Tutar Numara Vergi öğesinin vergi tutarı 60,00 60
Ücret Dize Vergi öğesinin vergi oranı %15

PaymentDetails

Alanda algılanan tüm ödeme seçeneklerini listeleyin.

Adı Tür Açıklama Metin (satır öğesi #1) Değer (standartlaştırılmış çıkış)
IBAN Dize İç Banka Hesap Numarası GB33BUKB20201555555555
SWIFT Dize SWIFT kodu BUKBGB22
BankAccountNumber Dize Banka hesabı numarası, bir banka hesabının benzersiz tanımlayıcısı 123456
BPayBillerCode Dize Australian B-Pay Biller Code 12345
BPayReference Dize Avustralya B-Ödeme Başvuru Kodu 98765432100

JSON çıkışı

JSON çıkışı üç bölümden oluşur:

  • "readResults" düğüm, tanınan tüm metinleri ve seçim işaretlerini içerir. Metin, sayfa, satır ve sonra tek tek sözcüklerle düzenlenir.
  • "pageResults" düğüm, sınırlayıcı kutularıyla ayıklanan tabloları ve hücreleri, güveni ve readResults içindeki satır ve sözcüklere başvuruyu içerir.
  • "documentResults" düğüm, modelin keşfettiği faturaya özgü değerleri ve satır öğelerini içerir. Faturadaki fatura kimliği, sevk yeri, fatura yeri, müşteri, toplam, satır öğeleri ve çok daha fazlası gibi tüm alanları bulabileceğiniz yerdir.

Geçiş kılavuzu

  • Uygulamalarınızda ve iş akışlarınızda v3.0 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.

Sonraki adımlar