Belge Zekası artımlı sınıflandırıcılarını kullanma
Bu içerik şunlar için geçerlidir: v4.0 (önizleme)
Azure AI Document Intelligence, akıllı belge işleme çözümleri oluşturmanıza olanak tanıyan bulut tabanlı bir Azure AI hizmetidir. Belge Yönetim Bilgileri API'leri çeşitli içeriği, düzeni, stili ve anlamsal öğeleri ayıklamak ve algılamak için görüntüleri, PDF'leri ve diğer belge dosyalarını analiz edin.
Belge Zekası özel sınıflandırma modelleri , uygulamalarınızda işlediğiniz belgeleri doğru bir şekilde algılamak ve tanımlamak için düzen ve dil özelliklerini birleştiren derin öğrenme modeli türleridir. Özel sınıflandırma modelleri, giriş dosyalarının sınıflandırmasını, içindeki belgeleri tanımlamak için birer birer gerçekleştirir ve ayrıca bir giriş dosyasındaki tek bir belgenin birden çok örneğini veya birden çok belgeyi tanımlayabilir.
Belge Yönetim Bilgileri belge sınıflandırıcıları, dosyalarda bilinen belge türlerini tanımlar. Birden çok belge türüne sahip bir giriş dosyasını işlerken veya belge türünü bilmediğiniz durumlarda, belgeyi tanımlamak için bir sınıflandırıcı kullanın. Aşağıdaki değişiklikler gerçekleştiğinde sınıflandırıcılar düzenli aralıklarla güncelleştirilmelidir:
- Mevcut bir sınıf için yeni şablonlar eklersiniz.
- Tanıma için yeni belge türleri eklersiniz.
- Sınıflandırıcı güvenilirliği düşük.
Bazı senaryolarda, artık sınıflandırıcıyı eğitmek için kullanılan özgün belge kümesine sahip olamazsınız. Artımlı eğitimle sınıflandırıcıyı yalnızca yeni etiketli örneklerle güncelleştirebilirsiniz.
Not
Artımlı eğitim, özel modeller için değil yalnızca belge sınıflandırıcı modelleri için geçerlidir.
Artımlı eğitim, özel sınıflandırıcının kalitesini artırmak istediğinizde kullanışlıdır. Mevcut sınıflar için yeni eğitim örnekleri eklemek, modelin mevcut belge türleri için güvenilirliğini artırır. Örneğin, mevcut formun yeni bir sürümü eklenirse veya yeni bir belge türü varsa. Örneğin, uygulamanız geçerli bir giriş olarak yeni bir belge türünü desteklemeye başladığında olabilir.
Artımlı eğitimi kullanmaya başlama
Artımlı eğitim, yeni API uç noktaları sunmaz.
İstek
documentClassifiers:build
yükü artımlı eğitimi destekleyecek şekilde değiştirilir.Artımlı eğitim, mevcut sınıflandırıcı ile yeni bir sınıflandırıcı modelinin oluşturulmasına neden olur.
Yeni sınıflandırıcı, yeni sağlanan örneklerle birlikte eski sınıflandırıcının tüm belge örneklerini ve türlerini içerir. Uygulamanızın yeni eğitilen sınıflandırıcıyla çalışacak güncelleştirmeler olduğundan emin olmanız gerekir.
Not
Sınıflandırıcılar için kopyalama işlemi şu anda kullanılamıyor.
Artımlı sınıflandırıcı derleme isteği oluşturma
Artımlı sınıflandırıcı derleme isteği, derleme isteğine classify document
benzer ancak yeni baseClassifierId
özelliği içerir. baseClassifierId
, genişletmek istediğiniz mevcut sınıflandırıcıya ayarlanır. Örnek kümesindeki docTypes
farklı belge türleri için de sağlamanız gerekir. baseClassifier içinde var olan bir docType
sağlayarak, istekte sağlanan örnekler temel sınıflandırıcı eğitildiğinde sağlanan örneklere eklenir. Artımlı eğitime eklenen yeni docType
değerler yalnızca yeni sınıflandırıcıya eklenir. Örnekleri belirtme işlemi değişmeden kalır. Daha fazla bilgi için bkz. Sınıflandırıcı modelini eğitma.
Örnek POST isteği
Artımlı belge sınıflandırıcısı oluşturmak için örnek POST
istek
POST
{your-endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview
{
"classifierId": "myAdaptedClassifier",
"description": "Classifier description",
"baseClassifierId": "myOriginalClassifier",
"docTypes": {
"formA": {
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"prefix": "formADocs/"
}
},
"formB": {
"azureBlobFileListSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"fileList": "formB.jsonl"
}
}
}
}
POST yanıtı
Tüm Belge Yönetim Bilgileri API'leri zaman uyumsuzdur, döndürülen işlem konumunun yoklanması derleme işleminde bir durum sağlar. Sınıflandırıcıların eğitilmesi hızlıdır ve sınıflandırıcınız bir veya iki dakika içinde kullanıma hazır olabilir.
Başarıyla tamamlandıktan sonra:
- Başarılı
POST
yöntem, hizmetin isteği oluşturduğunu belirten bir202 OK
yanıt kodu döndürür. - Çevrilen belgeler hedef kapsayıcınızda bulunur.
- İstek
POST
, dahil olmak üzereOperation-Location
yanıt üst bilgilerini de döndürür. Bu üst bilginin değeri, zaman uyumsuz işlemin durumunu almak ve aynı kaynak abonelik anahtarınızla bir istek kullanarak sonuçları almak için sorgulanabilen birGET
içerirresultId
.
Örnek GET isteği
Artımlı belge sınıflandırıcısının sonucunu almak için örnek GET
istek
GET
{your-endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-02-29-preview
{
"classifierId": "myAdaptedClassifier",
"description": "Classifier description",
"createdDateTime": "2022-07-30T00:00:00Z",
"expirationDateTime": "2023-01-01T00:00:00Z",
"apiVersion": "2024-02-29-preview",
"baseClassifierId": "myOriginalClassifier",
"docTypes": {
"formA": {
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "formADocs/"
}
},
"formB": {
"azureBlobFileListSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"fileList": "formB.jsonl"
}
}
}
}
GET yanıtı
GET
Artımlı olarak eğitilen bir sınıflandırıcının yanıtı, standart sınıflandırıcı GET
yanıtından farklıdır. Artımlı olarak eğitilen sınıflandırıcı, desteklenen tüm belge türlerini döndürmez. Artımlı eğitim adımında eklenen veya güncelleştirilen belge türlerini ve genişletilmiş temel sınıflandırıcıyı döndürür. Belge türlerinin tam listesini almak için temel sınıflandırıcının listelenmiş olması gerekir. Temel sınıflandırıcının silinmesi, artımlı olarak eğitilmiş bir sınıflandırıcının kullanımını etkilemez.
Sınırlar
Artımlı eğitim yalnızca temel sınıflandırıcı ve artımlı olarak eğitilen sınıflandırıcı aynı API sürümünde eğitildiğinde çalışır. Sonuç olarak, artımlı olarak eğitilen sınıflandırıcı, temel sınıflandırıcıyla aynı model yaşam döngüsüne sahiptir.
Artımlı sınıflandırıcı için eğitim veri kümesi boyutu sınırları, diğer sınıflandırıcı modeliyle aynıdır. Geçerli sınırların tam listesi için bkz. hizmet sınırları.
Sonraki adımlar
- Belge sınıflandırması hakkında daha fazla bilgi edinin