Belge Zekası artımlı sınıflandırıcılarını kullanma

Bu içerik şunlar için geçerlidir: Checkmark v4.0 (önizleme) Checkmark

Azure AI Document Intelligence, akıllı belge işleme çözümleri oluşturmanıza olanak tanıyan bulut tabanlı bir Azure AI hizmetidir. Belge Yönetim Bilgileri API'leri çeşitli içeriği, düzeni, stili ve anlamsal öğeleri ayıklamak ve algılamak için görüntüleri, PDF'leri ve diğer belge dosyalarını analiz edin.

Belge Zekası özel sınıflandırma modelleri , uygulamalarınızda işlediğiniz belgeleri doğru bir şekilde algılamak ve tanımlamak için düzen ve dil özelliklerini birleştiren derin öğrenme modeli türleridir. Özel sınıflandırma modelleri, giriş dosyalarının sınıflandırmasını, içindeki belgeleri tanımlamak için birer birer gerçekleştirir ve ayrıca bir giriş dosyasındaki tek bir belgenin birden çok örneğini veya birden çok belgeyi tanımlayabilir.

Belge Yönetim Bilgileri belge sınıflandırıcıları, dosyalarda bilinen belge türlerini tanımlar. Birden çok belge türüne sahip bir giriş dosyasını işlerken veya belge türünü bilmediğiniz durumlarda, belgeyi tanımlamak için bir sınıflandırıcı kullanın. Aşağıdaki değişiklikler gerçekleştiğinde sınıflandırıcılar düzenli aralıklarla güncelleştirilmelidir:

  • Mevcut bir sınıf için yeni şablonlar eklersiniz.
  • Tanıma için yeni belge türleri eklersiniz.
  • Sınıflandırıcı güvenilirliği düşük.

Bazı senaryolarda, artık sınıflandırıcıyı eğitmek için kullanılan özgün belge kümesine sahip olamazsınız. Artımlı eğitimle sınıflandırıcıyı yalnızca yeni etiketli örneklerle güncelleştirebilirsiniz.

Not

Artımlı eğitim, özel modeller için değil yalnızca belge sınıflandırıcı modelleri için geçerlidir.

Artımlı eğitim, özel sınıflandırıcının kalitesini artırmak istediğinizde kullanışlıdır. Mevcut sınıflar için yeni eğitim örnekleri eklemek, modelin mevcut belge türleri için güvenilirliğini artırır. Örneğin, mevcut formun yeni bir sürümü eklenirse veya yeni bir belge türü varsa. Örneğin, uygulamanız geçerli bir giriş olarak yeni bir belge türünü desteklemeye başladığında olabilir.

Artımlı eğitimi kullanmaya başlama

  • Artımlı eğitim, yeni API uç noktaları sunmaz.

  • İstek documentClassifiers:build yükü artımlı eğitimi destekleyecek şekilde değiştirilir.

  • Artımlı eğitim, mevcut sınıflandırıcı ile yeni bir sınıflandırıcı modelinin oluşturulmasına neden olur.

  • Yeni sınıflandırıcı, yeni sağlanan örneklerle birlikte eski sınıflandırıcının tüm belge örneklerini ve türlerini içerir. Uygulamanızın yeni eğitilen sınıflandırıcıyla çalışacak güncelleştirmeler olduğundan emin olmanız gerekir.

    Not

    Sınıflandırıcılar için kopyalama işlemi şu anda kullanılamıyor.

Artımlı sınıflandırıcı derleme isteği oluşturma

Artımlı sınıflandırıcı derleme isteği, derleme isteğine classify document benzer ancak yeni baseClassifierId özelliği içerir. baseClassifierId, genişletmek istediğiniz mevcut sınıflandırıcıya ayarlanır. Örnek kümesindeki docTypes farklı belge türleri için de sağlamanız gerekir. baseClassifier içinde var olan bir docType sağlayarak, istekte sağlanan örnekler temel sınıflandırıcı eğitildiğinde sağlanan örneklere eklenir. Artımlı eğitime eklenen yeni docType değerler yalnızca yeni sınıflandırıcıya eklenir. Örnekleri belirtme işlemi değişmeden kalır. Daha fazla bilgi için bkz. Sınıflandırıcı modelini eğitma.

Örnek POST isteği

Artımlı belge sınıflandırıcısı oluşturmak için örnek POST istek

POST {your-endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview

{
  "classifierId": "myAdaptedClassifier",
  "description": "Classifier description",
  "baseClassifierId": "myOriginalClassifier",
  "docTypes": {
    "formA": {
      "azureBlobSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
        "prefix": "formADocs/"
      }
    },
    "formB": {
      "azureBlobFileListSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
        "fileList": "formB.jsonl"
      }
    }
  }
}

POST yanıtı

Tüm Belge Yönetim Bilgileri API'leri zaman uyumsuzdur, döndürülen işlem konumunun yoklanması derleme işleminde bir durum sağlar. Sınıflandırıcıların eğitilmesi hızlıdır ve sınıflandırıcınız bir veya iki dakika içinde kullanıma hazır olabilir.

Başarıyla tamamlandıktan sonra:

  • Başarılı POST yöntem, hizmetin isteği oluşturduğunu belirten bir 202 OK yanıt kodu döndürür.
  • Çevrilen belgeler hedef kapsayıcınızda bulunur.
  • İstek POST , dahil olmak üzere Operation-Locationyanıt üst bilgilerini de döndürür. Bu üst bilginin değeri, zaman uyumsuz işlemin durumunu almak ve aynı kaynak abonelik anahtarınızla bir istek kullanarak sonuçları almak için sorgulanabilen bir GET içerirresultId.

Örnek GET isteği

Artımlı belge sınıflandırıcısının sonucunu almak için örnek GET istek

GET {your-endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-02-29-preview


{
  "classifierId": "myAdaptedClassifier",
  "description": "Classifier description",
  "createdDateTime": "2022-07-30T00:00:00Z",
  "expirationDateTime": "2023-01-01T00:00:00Z",
  "apiVersion": "2024-02-29-preview",

  "baseClassifierId": "myOriginalClassifier",

  "docTypes": {
    "formA": {
      "azureBlobSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
        "prefix": "formADocs/"
      }
    },
    "formB": {
      "azureBlobFileListSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
        "fileList": "formB.jsonl"
      }
    }
  }
}

GET yanıtı

GET Artımlı olarak eğitilen bir sınıflandırıcının yanıtı, standart sınıflandırıcı GET yanıtından farklıdır. Artımlı olarak eğitilen sınıflandırıcı, desteklenen tüm belge türlerini döndürmez. Artımlı eğitim adımında eklenen veya güncelleştirilen belge türlerini ve genişletilmiş temel sınıflandırıcıyı döndürür. Belge türlerinin tam listesini almak için temel sınıflandırıcının listelenmiş olması gerekir. Temel sınıflandırıcının silinmesi, artımlı olarak eğitilmiş bir sınıflandırıcının kullanımını etkilemez.

Sınırlar

  • Artımlı eğitim yalnızca temel sınıflandırıcı ve artımlı olarak eğitilen sınıflandırıcı aynı API sürümünde eğitildiğinde çalışır. Sonuç olarak, artımlı olarak eğitilen sınıflandırıcı, temel sınıflandırıcıyla aynı model yaşam döngüsüne sahiptir.

  • Artımlı sınıflandırıcı için eğitim veri kümesi boyutu sınırları, diğer sınıflandırıcı modeliyle aynıdır. Geçerli sınırların tam listesi için bkz. hizmet sınırları.

Sonraki adımlar