Belge Yönetim Bilgileri Kimliği belge modeli
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürümler: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0 v2.1
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1 | Önceki sürüm: v2.1
Bu içerik şunlar için geçerlidir: v2.1 | En son sürüm: v4.0 (önizleme)
Belge Zekası Kimliği belgesi (ID) modeli, kimlik belgelerindeki önemli bilgileri analiz etmek ve ayıklamak için Optik Karakter Tanıma (OCR) ile derin öğrenme modellerini birleştirir. API, kimlik belgelerini (aşağıdakiler dahil) analiz eder ve yapılandırılmış bir JSON veri gösterimi döndürür:
- Dünya çapında pasaport defteri, pasaport kartı
- Birleşik Devletler, Avrupa, Hindistan, Kanada ve Avustralya'dan sürücü belgesi
- Birleşik Devletler kimlik kartları, oturma izni (yeşil kart), sosyal güvenlik kartı, askeri kimlik
- Avrupa kimlik kartları, ikamet izinleri
- Hindistan PAN kart, Aadhaar kart
- Kanada kimlik kartları, ikamet izni (akçaağaç kartı)
- Avustralya fotoğraf kartı, anahtar geçişi kimliği (dijital sürüm dahil)
Belge Zekası, önceden oluşturulmuş kimlik modelini kullanarak kamu tarafından verilen kimlik belgelerini (kimlikler) analiz edebilir ve bu belgelerden bilgi ayıklayabilir. Güçlü Optik Karakter Tanıma (OCR) özelliklerimizi kimlik tanıma özellikleriyle birleştirerek Dünya Çapında Pasaportlar ve ABD Sürücü Lisanslarından (50 eyaletin tamamı ve D.C.) önemli bilgileri ayıklar. Kimlikler API'si bu kimlik belgelerinden ad, soyadı, doğum tarihi, belge numarası ve daha fazlası gibi önemli bilgileri ayıklar. Bu API, Belge Zekası v2.1'de bulut hizmeti olarak kullanılabilir.
Kimlik belgesi işleme
Kimlik belgesi işleme, kimlik belgelerinden verileri el ile veya OCR tabanlı teknoloji kullanarak ayıklamayı içerir. Kimlik belgesi işleme, kimlik kanıtı gerektiren tüm iş operasyonlarında önemli bir adımdır. Örnek olarak bankalarda ve diğer finansal kurumlarda müşteri doğrulaması, ipotek uygulamaları, tıbbi ziyaretler, talep işleme, konaklama sektörü ve daha fazlası verilebilir. Kişiler ehliyetler, pasaportlar ve diğer benzer belgeler aracılığıyla kimliklerinin bazı kanıtlarını sağlar, böylece işletme hizmetleri ve avantajları sağlamadan önce bunları verimli bir şekilde doğrulayabilir.
Document Intelligence Studio ile işlenen örnek ABD Sürücü Lisansı
Veri ayıklama
Önceden oluşturulmuş kimlikler hizmeti, dünya çapındaki pasaportlardan ve ABD Sürücü Lisanslarından önemli değerleri ayıklar ve bunları düzenli bir yapılandırılmış JSON yanıtında döndürür.
Sürücü belgesi örneği
Passport örneği
Dağıtım seçenekleri
Document Intelligence v4.0 (2024-07-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Kimlik belgesi modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Kimlik belgesi modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Kimlik belgesi modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar |
---|---|
Kimlik belgesi modeli | • Belge Yönetim Bilgileri etiketleme aracı • REST API • İstemci kitaplığı SDK'sı • Belge Yönetim Bilgileri Docker kapsayıcısı |
Giriş gereksinimleri
Desteklenen dosya biçimleri:
Model PDF Resim: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve
4
ücretsiz (F0) katman için MB'tır.Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir
8
.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve
1
sinir modeli için GB'tır.Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır
1
. 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır2
.
Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
PDF ve TIFF dosyaları için desteklenen sayfa sayısı: 2.000 sayfaya kadar veya serbest katmanlı aboneler için yalnızca ilk iki sayfa.
Desteklenen dosya boyutu: TOPLAM 50 MB'tan az; minimum piksel: 50 x 50 piksel; maksimum piksel 10.000 x 10.000 piksel.
Kimlik belgesi modeli veri ayıklama
Kimlik belgelerinden ad, doğum tarihi ve son kullanma tarihi gibi verileri ayıklayın. Aşağıdaki kaynaklara ihtiyacınız vardır:
Azure aboneliği: Ücretsiz olarak bir abonelik oluşturabilirsiniz.
Azure portalında bir Belge Zekası örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (
F0
) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.
Not
Document Intelligence Studio, v3.1 ve v3.0 API'leri ve sonraki sürümlerle kullanılabilir.
Document Intelligence Studio giriş sayfasında Kimlik belgeleri'ni seçin.
Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.
Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:
Document Intelligence Studio'yu deneyin.
Belge Yönetim Bilgileri Örnek Etiketleme aracı
Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.
Açılan menüden analiz etmek için Form Türü'nü seçin.
Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:
Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.
Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.
Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.
Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş Api'yi Çözümle api'sini çağırır ve belgeyi analiz eder.
Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.
Ayrıntılı sonuçları görüntülemek için JSON çıkış dosyasını indirin.
- "readResults" düğümü, sayfada ilgili sınırlayıcı kutu yerleşimine sahip her metin satırını içerir.
- "selectionMarks" düğümü her seçim işaretini (onay kutusu, radyo işareti) ve durumunun seçili mi yoksa seçilmemiş mi olduğunu gösterir.
- "pageResults" bölümü ayıklanan tabloları içerir. Belge Yönetim Bilgileri her tablo için metin, satır ve sütun dizini, yayılan satır ve sütun, sınırlayıcı kutu ve daha fazlasını ayıklar.
- "documentResults" alanı, belgenin en ilgili bölümleri için anahtar/değer çiftleri bilgilerini ve satır öğeleri bilgilerini içerir.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Desteklenen belge türleri
Bölge | Belge türleri |
---|---|
Dünya | Pasaport Defteri, Pasaport Kartı |
ABD | Sürücü Belgesi, Kimlik Kartı, İkamet İzni (Yeşil kart), Sosyal Güvenlik Kartı, Askeri Kimlik |
Avrupa | Sürücü Belgesi, Kimlik Kartı, İkamet İzni |
Hindistan | Sürücü Belgesi, PAN Kartı, Aadhaar Kartı |
Kanada | Sürücü Belgesi, Kimlik Kartı, İkamet İzni (Akçaağaç Kartı) |
Avustralya | Sürücü Lisansı, Fotoğraf Kartı, Anahtar geçişi kimliği (dijital sürüm dahil) |
Alan ayıklamaları
Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki kimlik belgesi modeli şema sayfasına bakın.
Desteklenen belge türleri
Kimlik belgesi modeli şu anda ABD sürücü lisanslarını ve uluslararası pasaportlardan (vize ve diğer seyahat belgeleri hariç) çıkarma biyografi sayfasını destekler.
Ayıklanan alanlar
Adı | Tür | Açıklama | Değer |
---|---|---|---|
Country | ülke | ISO 3166 standardıyla uyumlu ülke kodu | "ABD" |
DateOfBirth | tarih | YYYY-AA-GG biçiminde DOB | "1980-01-01" |
DateOfExpiration | tarih | YYYY-AA-GG biçiminde son kullanma tarihi | "2019-05-05" |
DocumentNumber | Dize | İlgili pasaport numarası, ehliyet numarası vb. | "340020013" |
FirstName | Dize | Varsa verilen ad ve ikinci baş harf ayıklandı | "JENNIFER" |
LastName | Dize | Ayıklanan soyadı | "BROOKS" |
Uyruk | ülke | ISO 3166 standardıyla uyumlu ülke kodu | "ABD" |
Cinsiyet | cinsiyet | Ayıklanan olası değerler şunlardır: "M" "F" "X" | "F" |
MachineReadableZone | nesne | Her biri 44 karakterden oluşan iki satır içeren ayıklanmış Passport MRZ |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | Dize | Belge türü, örneğin, Passport, Sürücü Lisansı | "Pasaport" |
Adres | Dize | Ayıklanan adres (yalnızca Sürücü Lisansı) | "123 SOKAK ADRESİ ŞEHİr WA 99999-1234" |
Bölge | Dize | Ayıklanan bölge, eyalet, il vb. (Yalnızca Sürücü Lisansı) | "Washington" |
Geçiş kılavuzu
Sonraki adımlar
Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.
Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.