Belge Zekası kartvizit modeli

Önemli

Document Intelligence v4.0 (önizleme) sürümünden başlayarak ve bundan sonra kartvizit modeli (önceden oluşturulmuş businessCard) kullanım dışı bırakılmıştır. Kartvizit biçimlerinden veri ayıklamak için aşağıdakileri kullanın:

Özellik sürüm Model Kimliği
Kartvizit modeli • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Bu içerik şunlar için geçerlidir:Checkmark v3.1 (GA) | Önceki sürümler: mavi onay işareti v3.0mavi onay işareti v2.1

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler: mor onay işareti v4.0 (önizleme) mor onay işaretiv3.1 | Önceki sürüm: mavi onay işareti v2.1

[! INCLUDE [v2.1 için geçerlidir].. /(includes/applies-to-v21.md)]

Belge Zekası kartvizit modeli, kartvizit görüntülerindeki verileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleriyle birleştirir. API, yazdırılan kartvizitleri analiz eder; ad, soyadı, şirket adı, e-posta adresi ve telefon numarası gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür.

Kartvizit veri ayıklama

Kartvizitler, bir işletmeyi veya profesyoneli temsil etmenin harika bir yoludur. Kartvizitlerde bulunan şirket logosu, yazı tipleri ve arka plan resimleri, şirket markasını yükseltmeye ve diğerlerinden ayırt etmelerine yardımcı olur. Kartvizit taramasını otomatikleştirmek için OCR ve makine öğrenmesi tabanlı teknikler uygulamak yaygın bir görüntü işleme senaryosudur. Satış ve pazarlama ekipleri tarafından kullanılan kurumsal sistemler genellikle kullanıcılarının yararına kartvizit veri ayıklama özelliği tümleştirmesine sahiptir.

Document Intelligence Studio ile işlenen örnek kartvizit

Document Intelligence Studio'da analiz edilen örnek kartvizitin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek iş

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla analiz edilen örnek kartvizitin ekran görüntüsü.

Dağıtım seçenekleri

Belge Yönetim Bilgileri v3.1:2023-07-31 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Kartvizit modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK'sı
JavaScript SDK'sı
önceden oluşturulmuş businessCard

Belge Yönetim Bilgileri v3.0:2022-08-31 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Kartvizit modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK'sı
JavaScript SDK'sı
önceden oluşturulmuş businessCard

Document Intelligence v2.1 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar
Kartvizit modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Zekası Docker kapsayıcısı

Kartvizit veri ayıklamayı deneyin

Ad, iş unvanı, adres, e-posta ve şirket adı gibi verilerin kartvizitlerden nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:

  • Azure aboneliği: Ücretsiz bir abonelik oluşturabilirsiniz

  • Azure portalında bir Belge Zekası örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Belge Makine Zekası Stüdyosu

Not

Document Intelligence Studio, v3.1 ve v3.0 API'leriyle kullanılabilir.

  1. Document Intelligence Studio giriş sayfasında Kartvizitler'i seçin.

  2. Örnek kartviziti analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracı

  1. Belge Yönetim Bilgileri Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Select-form-type açılan menüsünün ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Analiz Et ve belgeyi analiz et'i çağırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Kartvizit modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Giriş gereksinimleri

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Okundu
    Düzen ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-07-31-preview, 2024-02-29-preview)
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF
  • PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
  • Dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en çok 10.000 x 10.000 piksel olmalıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.

Alan ayıklamaları

Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki kartvizit modeli şema sayfasına bakın.

Ayıklanan alanlar

Adı Tür Açıklama Metin
Kişi Adları nesne dizisi Kartvizitten ayıklanan kişi adı [{ "FirstName": "John", "LastName": "Doe" }]
FirstName Dize Kişinin adı (verilen) "John"
LastName Dize Kişinin soyadı (aile) adı "Doe"
Şirket Adları dizeler dizisi Kartvizitten ayıklanan şirket adı ["Contoso"]
Departmanlar dizeler dizisi İlgili kişi departmanı veya kuruluşu ["R&D"]
jobtitles dizeler dizisi İlgili kişinin İş unvanı ["Yazılım Mühendisi"]
E-postalar dizeler dizisi Kartvizitten ayıklanan kişi e-postası [""johndoe@contoso.com]
Web siteleri dizeler dizisi Kartvizitten ayıklanan web sitesi ["https://www.contoso.com"]
Adresler dizeler dizisi Kartvizitten ayıklanan adres ["123 Main Street, Redmond, Washington 98052"]
Cep Telefonları telefon numaraları dizisi Kartvizitten ayıklanan cep telefonu numarası ["+19876543210"]
Fakslar telefon numaraları dizisi Kartvizitten ayıklanan faks telefon numarası ["+19876543211"]
WorkPhone'lar telefon numaraları dizisi Kartvizitten ayıklanan iş telefonu numarası ["+19876543231"]
Diğer Telefonlar telefon numaraları dizisi Kartvizitten ayıklanan diğer telefon numarası ["+19876543233"]

Desteklenen yerel ayarlar

Önceden oluşturulmuş kartvizitler v2.1 aşağıdaki yerel ayarları destekler:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

Geçiş kılavuzu ve REST API v3.1

  • Uygulamalarınızda ve iş akışlarınızda v3.0 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.

Sonraki adımlar

  • Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin

  • Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.

  • Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işlemeyi deneyin

  • Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.