Akıllı Belge oluşturma özel modelleri
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürümler: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0 v2.1
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1 | Önceki sürüm: v2.1
Bu içerik şunlar için geçerlidir: v2.1 | En son sürüm: v4.0 (önizleme)
Önemli
İşlem model compose
davranışı api-version=2024-07-31-preview sürümünden değişiyor. model compose
v4.0 ve üzeri işlemi, analiz için örtük bir sınıflandırıcı yerine açıkça eğitilmiş bir sınıflandırıcı ekler. Önceki oluşturulan model sürümü için bkz . Oluşturulan özel modeller v3.1. Şu anda oluşturulmuş modeller kullanıyorsanız en son uygulamaya yükseltmeyi göz önünde bulundurun.
Oluşturulan model nedir?
Oluşturulan modellerle, birden çok özel modeli tek bir model kimliğiyle adlı bir oluşturulmuş modelde gruplandırabilirsiniz. Örneğin, oluşturulan modeliniz tedarik, ekipman ve mobilya satın alma siparişlerinizi analiz etmek için eğitilmiş özel modeller içerebilir. Uygun modeli el ile seçmeye çalışmak yerine, oluşturulan modeli kullanarak her analiz ve ayıklama için uygun özel modeli belirleyebilirsiniz.
Bazı senaryolarda önce belgenin sınıflandırılıp ardından modelden alanları ayıklamak için en uygun modelle belgenin çözümlenmesi gerekir. Bu tür senaryolar, kullanıcının belgeyi karşıya yüklediği ancak belge türünün açıkça bilinmediği senaryoları içerebilir. Başka bir senaryo, birden çok belge birlikte tek bir dosyada tarandığında ve dosya işlenmek üzere gönderildiğinde olabilir. Ardından uygulamanızın bileşen belgelerini tanımlaması ve her belge için en iyi modeli seçmesi gerekir.
Önceki sürümlerde işlem, gönderilen belgeyi model compose
en iyi temsil eden özel modeli belirlemek için örtük bir sınıflandırma gerçekleştirdi. İşlemin 2024-07-31-preview
model compose
uygulanması, önceki sürümlerden örtük sınıflandırmayı açık bir sınıflandırma adımıyla değiştirir ve koşullu yönlendirme ekler.
Yeni model oluşturma işleminin avantajları
Yeni model compose
işlem, açık bir sınıflandırıcıyı eğitmeni gerektirir ve çeşitli avantajlar sağlar.
Sürekli artımlı geliştirme. Daha fazla örnek ekleyerek ve sınıflandırmayı artımlı olarak iyileştirerek sınıflandırıcının kalitesini tutarlı bir şekilde geliştirebilirsiniz. Bu ince ayar, belgelerinizin her zaman ayıklama için doğru modele yönlendirilmesini sağlar.
Yönlendirme üzerinde tam denetim. Güvenilirlik tabanlı yönlendirme ekleyerek, belge türü ve sınıflandırma yanıtı için bir güvenilirlik eşiği sağlarsınız.
İşlem sırasında belgenin belirli belge türlerini yoksayın. İşlemin
model compose
önceki uygulamaları, en yüksek güvenilirlik puanları görece düşük olsa bile güvenilirlik puanına göre ayıklama için en iyi analiz modelini seçti. Güvenilirlik eşiği sağlayarak veya bilinen bir belge türünü sınıflandırmadan ayıklama modeline açıkça eşlemeyerek, belirli belge türlerini yoksayabilirsiniz.Aynı belge türünün birden çok örneğini analiz edin. Sınıflandırıcı seçeneğiyle
splitMode
eşleştirildiğinde,model compose
işlem bir dosyadaki aynı belgenin birden çok örneğini algılayabilir ve her belgeyi bağımsız olarak işlemek için dosyayı bölebilir. kullanaraksplitMode
tek bir istekte belgenin birden çok örneğinin işlenmesini sağlar.Özelliklere ekleme desteği. Sorgu alanları veya barkodlar gibi özelliklere ekleme, analiz modeli parametrelerinin bir parçası olarak da belirtilebilir.
Atanan özel model üst sınırı 500'e genişletildi. İşlemin
model compose
yeni uygulaması, tek bir oluşturulan modele en fazla 500 eğitilmiş özel model atamanızı sağlar.
Model oluşturma özelliğini kullanma
Ayıklanması veya yoksayılması gereken bilgiler içeren örnekler de dahil olmak üzere tüm gerekli belgelerinizin örneklerini toplayarak başlayın.
Klasör adlarının, oluşturulan model tanımınızda kullanmayı düşündüğünüz belge türü olduğu klasörlerdeki belgeleri düzenleyerek sınıflandırıcıyı eğitin.
Son olarak, kullanmayı planladığınız belge türlerinin her biri için bir ayıklama modeli eğitin.
Sınıflandırma ve ayıklama modelleriniz eğitildikten sonra, sınıflandırma ve ayıklama modellerini birleştirilmiş bir modelde oluşturmak için Document Intelligence Studio, istemci kitaplıkları veya REST API'sini kullanın.
splitMode
Dosya bölme davranışını denetlemek için parametresini kullanın:
- Yok. Dosyanın tamamı tek bir belge olarak değerlendirilir.
- perPage. Dosyadaki her sayfa ayrı bir belge olarak değerlendirilir.
- otomatik olarak seçin. Dosya otomatik olarak belgelere bölünür.
Fatura ve fiyatlandırma
Oluşturulan modeller, tek tek özel modellerde olduğu gibi faturalandırılır. Fiyatlandırma, aşağı akış analiz modeli tarafından analiz edilen sayfa sayısına bağlıdır. Faturalama, bir ayıklama modeline yönlendirilen sayfaların ayıklama fiyatını temel alır. Açık sınıflandırma ücretlerinin eklenmesiyle, giriş dosyasındaki tüm sayfaların sınıflandırması için tahakkuk eder. Daha fazla bilgi için Bkz. Belge Zekası fiyatlandırma sayfası.
Model oluşturma işlemini kullanma
Tek bir modelde oluşturmak istediğiniz tüm model kimliklerinin listesini oluşturarak başlayın.
Studio, REST API veya istemci kitaplıklarını kullanarak modelleri tek bir model kimliğinde oluşturun.
Belgeleri analiz etmek için oluşturulan model kimliğini kullanın.
Faturalandırma
Oluşturulan modeller, tek tek özel modellerde olduğu gibi faturalandırılır. Fiyatlandırma, analiz edilen sayfa sayısına bağlıdır. Faturalama, bir ayıklama modeline yönlendirilen sayfaların ayıklama fiyatını temel alır. Daha fazla bilgi için Bkz. Belge Zekası fiyatlandırma sayfası.
- Tek bir özel model veya oluşturulmuş bir özel model kullanarak belgeyi analiz etmek için fiyatlandırmada bir değişiklik yoktur.
Oluşturulan modeller özellikleri
Custom template
vecustom neural
modelleri birden çok API sürümünde tek bir oluşturulmuş model halinde bir araya getirilebilir.Yanıt, belgeyi analiz etmek için oluşturulan modellerden hangisinin kullanıldığını belirten bir
docType
özellik içerir.Modeller için
custom template
, oluşturulan model özel bir şablonun çeşitlemeleri veya farklı form türleri kullanılarak oluşturulabilir. Bu işlem, gelen formlar çeşitli şablonlardan birine ait olduğunda kullanışlıdır.Modeller için
custom neural
en iyi yöntem, tek bir belge türünün tüm farklı çeşitlemelerini tek bir eğitim veri kümesine eklemek ve özel sinir modeli üzerinde eğitmektir. İşlemmodel compose
, analiz için gönderilen farklı türlerdeki belgeleriniz olduğunda senaryolar için en uygun seçenektir.
Model sınırları oluşturma
İşlemle
model compose
, tek bir model kimliğine en fazla 500 model atayabilirsiniz. Oluşturmak istediğim model sayısı, oluşturulan modelin üst sınırını aşarsa, şu alternatiflerden birini kullanabilirsiniz:Özel modeli çağırmadan önce belgeleri sınıflandırın. Kod, normal ifadeler veya arama gibi kaynakları kullanarak Okuma modelini kullanabilir ve belgelerden ayıklanan metinleri ve belirli tümcecikleri temel alan bir sınıflandırma oluşturabilirsiniz.
Aynı alanları çeşitli yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış belgelerden ayıklamak istiyorsanız, derin öğrenme özel sinir modelini kullanmayı göz önünde bulundurun. Özel şablon modeli ile özel sinir modeli arasındaki farklar hakkında daha fazla bilgi edinin.
Oluşturulan modelleri kullanarak belgeyi çözümlemek, tek bir model kullanarak belgeyi çözümlemekle aynıdır. Sonuç,
Analyze Document
belgeyi analiz etmek için hangi bileşen modellerini seçtiğinizi gösteren birdocType
özellik döndürür.İşlem
model compose
şu anda yalnızca etiketlerle eğitilen özel modeller için kullanılabilir.
Oluşturulan model uyumluluğu
Özel model türü | v2.1 ve v2.0 ile eğitilen modeller | Özel şablon ve sinir modelleri v3.1 ve v3.0 | Özel şablon ve sinir modelleri v4.0 önizlemesi | Özel Üretken modeller v4.0 önizlemesi |
---|---|---|---|---|
Sürüm 2.1 ve v2.0 ile eğitilen modeller | Desteklenmiyor | Desteklenmiyor | Desteklenmiyor | Desteklenmiyor |
Özel şablon ve sinir modelleri v3.0 ve v3.1 | Desteklenmiyor | Desteklenir | Desteklenir | Desteklenmiyor |
Özel şablon ve sinir modelleri v4.0 önizlemesi | Desteklenmiyor | Desteklenir | Desteklenir | Desteklenmiyor |
Özel üretken modeller v4.0 önizlemesi | Desteklenmiyor | Desteklenmiyor | Desteklenmiyor | Desteklenmiyor |
API'nin önceki bir sürümüyle eğitilmiş bir model oluşturmak için (v2.1 veya öncesi), aynı etiketli veri kümesini kullanarak v3.0 API'siyle bir model eğitin. Bu ekleme, v2.1 modelinin diğer modellerle oluşturulabilmesini sağlar.
API'nin v2.1 kullanılarak oluşturulan modellerle destek almaya devam eder ve güncelleştirme gerektirmez.
Dağıtım seçenekleri
Document Intelligence v4.0:2024-07-31-preview aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar |
---|---|
Özel model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Oluşturulan model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Belge Yönetim Bilgileri v3.1:2023-07-31 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar |
---|---|
Özel model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Oluşturulan model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Belge Yönetim Bilgileri v3.0:2022-08-31 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar |
---|---|
Özel model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Oluşturulan model | • Document Intelligence Studio • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v2.1 aşağıdaki kaynakları destekler:
Özellik | Kaynaklar |
---|---|
Özel model | • Belge Zekası etiketleme aracı • REST API • İstemci kitaplığı SDK'sı • Belge Zekası Docker kapsayıcısı |
Oluşturulan model | • Belge Zekası etiketleme aracı • REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Sonraki adımlar
Özel modeller oluşturmayı ve oluşturmayı öğrenin: