Özel Translator anahtar terimleri
Aşağıdaki tabloda, Özel Çeviri Aracı ile çalışırken bulabileceğiniz önemli terimlerin listesi yer alır.
Sözcük veya Tümcecik | Tanım |
---|---|
Kaynak Dil | Kaynak dil, başka bir dile ("hedef") dönüştürmek istediğiniz başlangıç dilidir. |
Hedef Dil | Hedef dil, makine çevirisinin kaynak dili aldıktan sonra sağlamasını istediğiniz dildir. |
Tek Dilli Dosya | Tek dilli bir dosya, farklı bir dilde başka bir dosyayla eşleştirilmemiş tek bir dile sahiptir. |
Paralel Dosyalar | Paralel dosya, karşılık gelen metinle iki dosyanın birleşimidir. Bir dosyada kaynak dil bulunur. Diğerinde hedef dil vardır. |
Tümce Hizalama | Paralel veri kümesi, her iki dilde de aynı metni temsil eden cümlelerle hizalanmış cümlelere sahip olmalıdır. Örneğin, bir kaynak paralel dosyada ilk cümle, teoride hedef paralel dosyadaki ilk cümleye eşlenmelidir. |
Hizalanmış Metin | Dosya doğrulamanın en önemli adımlarından biri, tümceleri paralel belgelere hizalamaktır. Her şey farklı dillerde farklı şekilde ifade edilir. Ayrıca farklı diller farklı sözcük düzenlerine sahiptir. Bu adım, tümceleri eğitim için kullanılabilmesi için aynı içerikle hizalama işini yapar. Düşük tümce hizalaması, dosyalardan birinde veya her ikisinde de bir sorun olabileceğini gösterir. |
Sözcük Kırıyor/ Bölünemez | Sözcük kesme, sözcükler arasındaki sınırları işaretleme işlevidir. Birçok yazma sistemi, sözcükler arasındaki sınırı belirtmek için bir boşluk kullanır. Sözcük bölünmez, önceki adımda sözcükler arasına eklenmiş olabilecek görünür işaretçilerin kaldırılmasını ifade eder. |
Sınırlayıcı | Sınırlayıcılar, tümcenin segmentlere bölünmesi veya cümleler arasındaki kenar boşluğunun sınırlandırılmış olmasıdır. Örneğin, İngilizce boşluklarda sözcükleri, iki nokta üst üste ve noktalı virgülle sınırlandırma yan tümceleri ve noktalı virgüller tümceleri sınırlar. |
Eğitim Dosyaları | Eğitim dosyası, makine çevirisi sistemine bir dilden (kaynak) hedef dile (hedef) nasıl eşleme yapılacağını öğretmek için kullanılır. Ne kadar çok veri sağlarsanız, sistem o kadar iyi performans gösterir. |
Dosyaları Ayarlama | Bu dosyalar genellikle eğitim kümesinden rastgele türetilir (ayarlama kümesi seçmezseniz). Cümleler otomatik olarak seçilir ve sistemi ayarlamak ve düzgün çalıştığından emin olmak için kullanılır. Genel amaçlı bir çeviri modeli oluşturmak ve kendi ayarlama dosyalarınızı oluşturmak istiyorsanız, bunların etki alanları arasında rastgele bir cümle kümesi olduğundan emin olun |
Dosyaları Test Etme | Bu dosyalar genellikle eğitim kümesinden rastgele seçilen türetilmiş dosyalardır (herhangi bir test kümesi seçmezseniz). Bu cümlelerin amacı, çeviri modelinin doğruluğunu değerlendirmektir. Sistemin bu cümleleri doğru bir şekilde çevirdiğinden emin olmak için bir test kümesi oluşturup çeviriciye yüklemek isteyebilirsiniz. Bunun yapılması, tümcelerin sistemin değerlendirmesinde (BLEU puanının oluşturulması) kullanılmasını sağlar. |
Birleşik giriş dosyası | Kaynak ve çevrilmiş tümcelerin aynı dosyada yer aldığı dosya türü. Desteklenen dosya biçimleri (TMX, XLIFF, XLF, ICI ve XLSX). |
Arşiv dosyası | Diğer dosyaları içeren bir dosya. Desteklenen dosya biçimleri (zip, gz, tgz). |
BLEU Puanı | BLEU , çeviri modelinin "duyarlığını" veya doğruluğunu değerlendirmek için endüstri standardı bir yöntemdir. Diğer değerlendirme yöntemleri mevcut olsa da Microsoft Çeviri, doğruluğu Proje Sahiplerine bildirmek için BLEU yöntemini kullanır. |