Belge Yönetim Bilgileri fatura modeli
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürümler: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0 v2.1
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1 | Önceki sürüm: v2.1
Bu içerik şunlar için geçerlidir: v2.1 | En son sürüm: v4.0 (önizleme)
Belge Yönetim Bilgileri fatura modeli, satış faturalarından, yardımcı program faturalarından ve satınalma siparişlerinden önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Faturalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler gibi çeşitli biçimlerde ve kalitede olabilir. API fatura metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda 27 dilde faturaları desteklemektedir.
Desteklenen belge türleri:
- Faturalar
- Yardımcı program faturaları
- Satış siparişleri
- Satınalma siparişleri
Otomatik fatura işleme
Otomatik fatura işleme, ödeme hesabı belgelerinden anahtar accounts payable
alanları ayıklama işlemidir. Ayıklanan veriler, gözden geçirmeler ve ödemeler için borç hesapları (AP) iş akışlarınızla tümleştirilmiş faturalardan gelen satır öğelerini içerir. Geçmişte, borç hesapları işlemi el ile gerçekleştirilir ve bu nedenle çok zaman alır. Anahtar verilerin faturalardan doğru şekilde ayıkılması genellikle fatura otomasyon sürecinin ilk ve en kritik adımlarından biridir.
Document Intelligence Studio ile işlenen örnek fatura:
Dağıtım seçenekleri
Document Intelligence v4.0 (2024-07-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Fatura modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş fatura |
Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Fatura modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş fatura |
Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Fatura modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş fatura |
Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar |
---|---|
Fatura modeli | • Belge Yönetim Bilgileri etiketleme aracı • REST API • İstemci kitaplığı SDK'sı • Belge Yönetim Bilgileri Docker kapsayıcısı |
Giriş gereksinimleri
Desteklenen dosya biçimleri:
Model PDF Resim: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve
4
ücretsiz (F0) katman için MB'tır.Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir
8
.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve
1
sinir modeli için GB'tır.Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır
1
. 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır2
.
- Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
- Desteklenen PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
- Desteklenen dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel olmalıdır.
Fatura modeli veri ayıklama
Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:
Azure aboneliği: Ücretsiz olarak bir abonelik oluşturabilirsiniz.
Azure portalında bir Belge Zekası örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (
F0
) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.
Document Intelligence Studio giriş sayfasında Faturalar'ı seçin.
Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.
Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:
Belge Yönetim Bilgileri Örnek Etiketleme aracı
Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.
Açılan menüden analiz etmek için Form Türü'nü seçin.
Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:
Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.
Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.
Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.
Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Analiz Et ve belgeyi analiz et'i çağırır.
Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Desteklenen diller ve yerel ayarlar
Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.
Alan ayıklama
Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki fatura modeli şema sayfasına bakın.
Ayıklanan fatura anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır
documentResults
.
Anahtar değer çiftleri
Önceden oluşturulmuş fatura 2022-06-30 ve üzeri sürümler anahtar-değer çiftlerinin isteğe bağlı dönüşünü destekler. Varsayılan olarak, anahtar-değer çiftlerinin dönüşü devre dışıdır. Anahtar-değer çiftleri, faturada bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Bir faturada, bu çiftler etiket ve kullanıcının bu alan veya telefon numarası için girdiği değer olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.
Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri her zaman belgede yer alan metin aralıklarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).
Ayıklanan alanlar
Fatura hizmeti metin, tablo ve 26 fatura alanını ayıklar. JSON çıkış yanıtında bir faturadan ayıklanan alanlar aşağıda verilmiştir (aşağıdaki çıktıda bu örnek fatura kullanılmıştır).
Adı | Tür | Açıklama | Metin | Değer (standartlaştırılmış çıkış) |
---|---|---|---|---|
CustomerName | Dize | Faturalanan müşteri | Microsoft Corp | |
CustomerId | Dize | Müşterinin başvuru kimliği | CID-12345 | |
PurchaseOrder | Dize | Satınalma siparişi başvuru numarası | PO-3333 | |
InvoiceId | Dize | Bu belirli faturanın kimliği (genellikle "Fatura Numarası") | TERS-100 | |
InvoiceDate | tarih | Faturanın düzenlendiği tarih | 11/15/2019 | 2019-11-15 |
DueDate | tarih | Bu faturanın ödeme tarihi | 15.12.2019 | 2019-12-15 |
VendorName | Dize | Faturayı oluşturan satıcı | CONTOSO | |
VendorAddress | Dize | Satıcının posta adresi | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | Dize | VendorAddress ile ilişkili ad | Contoso Genel Merkezi | |
CustomerAddress | Dize | Müşteri için posta adresi | 123 Diğer Cadde, Redmond, Washington, 98052 | |
CustomerAddressRecipient | Dize | CustomerAddress ile ilişkili ad | Microsoft Corp | |
BillingAddress | Dize | Müşteri için açık faturalama adresi | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | Dize | BillingAddress ile ilişkilendirilmiş ad | Microsoft Hizmetleri | |
ShippingAddress | Dize | Müşteri için açık sevkiyat adresi | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | Dize | ShippingAddress ile ilişkilendirilmiş ad | Microsoft Teslimi | |
Ara toplam | Numara | Bu faturada tanımlanan alt toplam alanı | $100,00 | 100 |
TotalTax | Numara | Bu faturada tanımlanan toplam vergi alanı | $10,00 | 10 |
InvoiceTotal | Numara | Bu faturayla ilişkili toplam yeni ücretler | 110,00 ABD doları | 110 |
AmountDue | Numara | Satıcıdan Kaynaklanan Toplam Tutar | 610,00 ABD doları | 610 |
ServiceAddress | Dize | Müşteri için açık hizmet adresi veya özellik adresi | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | Dize | ServiceAddress ile ilişkilendirilmiş ad | Microsoft Hizmetleri | |
RemittanceAddress | Dize | Müşteri için açık havale veya ödeme adresi | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | Dize | RemittanceAddress ile ilişkili ad | Contoso Faturalama | |
ServiceStartDate | tarih | Hizmet döneminin ilk tarihi (örneğin, bir hizmet faturası hizmet dönemi) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | tarih | Hizmet döneminin bitiş tarihi (örneğin, bir yardımcı program faturası hizmet dönemi) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | Numara | Önceden ödenmemiş açık bakiye | 500,00 ABD doları | 500 |
JSON çıkış yanıtında bir faturadan ayıklanan ve bu örnek faturayı kullanan satır öğeleri aşağıda verilmişti:
Adı | Tür | Açıklama | Metin (satır öğesi #1) | Değer (standartlaştırılmış çıkış) |
---|---|---|---|---|
Items | Dize | Satır öğesinin tam dize metin satırı | 4/3/2021 A123 Danışmanlık Hizmetleri 2 saat $30,00 10% 60,00 $ | |
Tutar | Numara | Satır öğesinin miktarı | 60,00 ABD doları | 100 |
Açıklama | Dize | Fatura satırı öğesinin metin açıklaması | Danışmanlık hizmeti | Danışmanlık hizmeti |
Miktar | Numara | Bu fatura satırı maddesinin miktarı | 2 | 2 |
UnitPrice | Numara | Bu öğenin bir biriminin net veya brüt fiyatı (faturanın brüt fatura ayarına bağlı olarak) | $30,00 | 30 |
ProductCode | Dize | Belirli bir satır öğesiyle ilişkili ürün kodu, ürün numarası veya SKU | A123 | |
Unit | Dize | Satır öğesinin birimi, örneğin kg, lb vb. | saat | |
Tarih | tarih | Her satır öğesine karşılık gelen tarih. Bu genellikle satır öğesinin sevk edildiği tarihtir | 3/4/2021 | 2021-03-04 |
Vergi | Numara | Her satır öğesiyle ilişkili vergi. Olası değerler arasında vergi tutarı, vergi % ve vergi Y/N yer alır | %10 |
JSON çıkış yanıtında bir faturadan ayıklanan karmaşık alanlar şunlardır:
TaxDetails
Vergi ayrıntıları, fatura toplamına uygulanan belirli vergileri tanımlar.
Adı | Tür | Açıklama | Metin (satır öğesi #1) | Değer (standartlaştırılmış çıkış) |
---|---|---|---|---|
Items | Dize | Vergi öğesinin tam dize metin satırı | V.A.T. %15 $60,00 | |
Tutar | Numara | Vergi öğesinin vergi tutarı | 60,00 | 60 |
Ücret | Dize | Vergi öğesinin vergi oranı | %15 |
PaymentDetails
Alanda algılanan tüm ödeme seçeneklerini listeleyin.
Adı | Tür | Açıklama | Metin (satır öğesi #1) | Değer (standartlaştırılmış çıkış) |
---|---|---|---|---|
IBAN |
Dize | İç Banka Hesap Numarası | GB33BUKB20201555555555 | |
SWIFT |
Dize | SWIFT kodu | BUKBGB22 | |
BankAccountNumber | Dize | Banka hesabı numarası, bir banka hesabının benzersiz tanımlayıcısı | 123456 | |
BPayBillerCode | Dize | Australian B-Pay Biller Code | 12345 | |
BPayReference | Dize | Avustralya B-Ödeme Başvuru Kodu | 98765432100 |
JSON çıkışı
JSON çıkışı üç bölümden oluşur:
"readResults"
düğüm, tanınan tüm metinleri ve seçim işaretlerini içerir. Metin, sayfa, satır ve sonra tek tek sözcüklerle düzenlenir."pageResults"
düğüm, sınırlayıcı kutularıyla ayıklanan tabloları ve hücreleri, güveni ve readResults içindeki satır ve sözcüklere başvuruyu içerir."documentResults"
düğüm, modelin keşfettiği faturaya özgü değerleri ve satır öğelerini içerir. Faturadaki fatura kimliği, sevk yeri, fatura yeri, müşteri, toplam, satır öğeleri ve çok daha fazlası gibi tüm alanları bulabileceğiniz yerdir.
Geçiş kılavuzu
Sonraki adımlar
Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.
Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.