Etiketli veri kümeleri oluşturmaya yönelik ipuçları

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işareti v3.1 (GA)mavi onay işareti v3.0 (GA)

Bu içerik şunlar için geçerlidir: Checkmark v3.1 (GA) | En son sürüm: mor onay işareti v4.0 (önizleme) | Önceki sürümler: mavi onay işareti v3.0

Bu içerik şunlar için geçerlidir: Checkmark v3.0 (GA) | En son sürümler:mor onay işareti v4.0 (önizleme)mor onay işareti v3.1

Önemli

Etiketli veri kümeleri oluşturmaya yönelik en iyi yöntemler yalnızca özel şablon ve özel sinir modelleri için geçerlidir; özel üretici için Bkz . Özel Üretici

Bu makalede, Document Intelligence Studio'da özel model veri kümelerini etiketlemek için en iyi yöntemler vurgulanır. Çok sayıda etiketiniz, uzun belgeniz veya farklı yapıya sahip belgeleriniz olduğunda belgeleri etiketlemek zaman alabilir. Bu ipuçları, belgeleri daha verimli bir şekilde etiketlemenize yardımcı olmalıdır.

Video: Özel etiketler için en iyi yöntemler

  • Aşağıdaki video, daha yüksek doğrulukla özel modeller oluşturmanıza yardımcı olmak için tasarlanan iki sununun ikincisidir (ilk sunuda Dengeli veri kümesi oluşturma inceleniyor).

  • Seçili belgelerinizi etiketlemek için en iyi yöntemleri inceleyeceğiz. Anlamlı ve tutarlı etiketleme ile model performansında bir gelişme görmeniz gerekir.

Studio'da artık etiketlemek için belirli sözcükleri bulmanız gerektiğini bildiğiniz ancak belgenin neresinde bulabileceğinizi bilmediğiniz örnekler için bir arama kutusu bulunur. Sözcüğü veya tümceciği aramanız ve oluşumu etiketlemek için belgedeki belirli bölüme gitmeniz yeterlidir.

Tabloları otomatik olarak etiketleme

Çok sayıda satırı veya yoğun metni olan tabloları etiketlemek zor olabilir. Düzen tablosu ihtiyacınız olan sonucu ayıklarsa, bu sonucu kullanmanız ve etiketleme işlemini atlamanız yeterlidir. Düzen tablosunun tam olarak ihtiyacınız olmayan durumlarda, değer düzeni ayıklamalarından tablo alanını oluşturmakla başlayabilirsiniz. Sayfadaki tablo simgesini seçerek başlayın ve otomatik etiket düğmesini seçin. Ardından, değerleri gerektiği gibi düzenleyebilirsiniz. Otomatik etiket şu anda yalnızca tek sayfalı tabloları destekler.

Shift seçme

Geniş bir metin aralığını etiketlerken, her sözcüğü yayılma alanında işaretlemek yerine, etiketlemeyi hızlandırmak ve metin aralığındaki sözcükleri kaçırmamak için sözcükleri seçerken shift tuşunu basılı tutun.

Bölge etiketleme

Daha büyük metin aralıklarını etiketlemek için ikinci bir seçenek de bölge etiketlemeyi kullanmaktır. Bölge etiketleme kullanıldığında, OCR sonuçlar eğitim zamanında değere doldurulur. Vardiya seçimi ile bölge etiketleme arasındaki fark yalnızca vardiya etiketleme yaklaşımının sağladığı görsel geri bildirimdedir.

Etiket çakışan alanlar

Alanlar ve tablo hücreleri için çakışan alanlar desteklenir. Analiz sonuçlarınızın çakışan alanlar içermesini bekliyorsanız, eğitim veri kümesine belirli alan çakışmaları etiketli en az bir örnek eklemeniz gerekir. Çakışan bir alanı etiketlemek için bölge etiketleme özelliğini kullanarak her alanın bölgelerini seçin. Hem tam hem de kısmi çakışmalar desteklenir. Belgedeki herhangi bir sözcük yalnızca iki alan için etiketlenebilir.

Alan alt türleri

Alan oluştururken, post işlemeyi en aza indirmek için doğru alt türü seçin; örneğin tarihlerin dmy değerleri bir dd-mm-yyyy biçimde ayıklaması seçeneğini belirleyin.

Sonraki adımlar