Etiketli veri kümeleri oluşturmaya yönelik ipuçları
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1
Önemli
Etiketli veri kümeleri oluşturmaya yönelik en iyi yöntemler yalnızca özel şablon ve özel sinir modelleri için geçerlidir; özel üretici için Bkz . Özel Üretici
Bu makalede, Document Intelligence Studio'da özel model veri kümelerini etiketlemek için en iyi yöntemler vurgulanır. Çok sayıda etiketiniz, uzun belgeniz veya farklı yapıya sahip belgeleriniz olduğunda belgeleri etiketlemek zaman alabilir. Bu ipuçları, belgeleri daha verimli bir şekilde etiketlemenize yardımcı olmalıdır.
Video: Özel etiketler için en iyi yöntemler
Aşağıdaki video, daha yüksek doğrulukla özel modeller oluşturmanıza yardımcı olmak için tasarlanan iki sununun ikincisidir (ilk sunuda Dengeli veri kümesi oluşturma inceleniyor).
Seçili belgelerinizi etiketlemek için en iyi yöntemleri inceleyeceğiz. Anlamlı ve tutarlı etiketleme ile model performansında bir gelişme görmeniz gerekir.
Arama yap
Studio'da artık etiketlemek için belirli sözcükleri bulmanız gerektiğini bildiğiniz ancak belgenin neresinde bulabileceğinizi bilmediğiniz örnekler için bir arama kutusu bulunur. Sözcüğü veya tümceciği aramanız ve oluşumu etiketlemek için belgedeki belirli bölüme gitmeniz yeterlidir.
Tabloları otomatik olarak etiketleme
Çok sayıda satırı veya yoğun metni olan tabloları etiketlemek zor olabilir. Düzen tablosu ihtiyacınız olan sonucu ayıklarsa, bu sonucu kullanmanız ve etiketleme işlemini atlamanız yeterlidir. Düzen tablosunun tam olarak ihtiyacınız olmayan durumlarda, değer düzeni ayıklamalarından tablo alanını oluşturmakla başlayabilirsiniz. Sayfadaki tablo simgesini seçerek başlayın ve otomatik etiket düğmesini seçin. Ardından, değerleri gerektiği gibi düzenleyebilirsiniz. Otomatik etiket şu anda yalnızca tek sayfalı tabloları destekler.
Shift seçme
Geniş bir metin aralığını etiketlerken, her sözcüğü yayılma alanında işaretlemek yerine, etiketlemeyi hızlandırmak ve metin aralığındaki sözcükleri kaçırmamak için sözcükleri seçerken shift tuşunu basılı tutun.
Bölge etiketleme
Daha büyük metin aralıklarını etiketlemek için ikinci bir seçenek de bölge etiketlemeyi kullanmaktır. Bölge etiketleme kullanıldığında, OCR
sonuçlar eğitim zamanında değere doldurulur. Vardiya seçimi ile bölge etiketleme arasındaki fark yalnızca vardiya etiketleme yaklaşımının sağladığı görsel geri bildirimdedir.
Etiket çakışan alanlar
Alanlar ve tablo hücreleri için çakışan alanlar desteklenir. Analiz sonuçlarınızın çakışan alanlar içermesini bekliyorsanız, eğitim veri kümesine belirli alan çakışmaları etiketli en az bir örnek eklemeniz gerekir. Çakışan bir alanı etiketlemek için bölge etiketleme özelliğini kullanarak her alanın bölgelerini seçin. Hem tam hem de kısmi çakışmalar desteklenir. Belgedeki herhangi bir sözcük yalnızca iki alan için etiketlenebilir.
Alan alt türleri
Alan oluştururken, post işlemeyi en aza indirmek için doğru alt türü seçin; örneğin tarihlerin dmy
değerleri bir dd-mm-yyyy
biçimde ayıklaması seçeneğini belirleyin.
Sonraki adımlar
Özel etiketleme hakkında daha fazla bilgi edinin:
Özel şablon modelleri hakkında daha fazla bilgi edinin: