Görüntüleri toplama

Nesne algılama modelini, istediğiniz nesneleri algılayacak şekilde eğitmek için bu nesnelerin bulunduğu görüntüleri toplamanız gerekir. Daha iyi sonuçlar elde etmek için görüntü miktarı ve kalitesi ile ilgili yönergelere bağlı kalın.

Biçim ve boyut

Nesne algılama modelinizi eğiteceğiniz görüntülerin şu özelliklere sahip olması gerekir:

  • Biçim:

    • JPG
    • PNG
    • BMP
  • Boyut:

    • Eğitim için en fazla 6 MB
    • Minimum 256 piksel x 256 piksel genişliği/yüksekliği

Veri miktarı ve veri dengesi

En önemli nokta, yapay zeka modelinizi eğitmek için yeterli miktarda görüntüyü karşıya yüklemektir. İyi bir başlangıç noktası, eğitim kümesi için her nesne başına en az 15 görüntüye sahip olmaktır. Daha az görüntü kullanırsanız modeliniz gereksiz veya ilgili olmayan kavramları öğrenebilir. Modelinizi daha fazla görüntüyle eğitmeniz, doğruluğu artırmanızı sağlayacaktır.

Bir diğer nokta da verilerinizin dengeli olmasını sağlamaktır. Örneğin bir nesne için 500 görüntü, başka bir nesne için ise 50 görüntü olması durumunda eğitim veri kümesi dengesiz olacaktır. Bu da modelin bir öğeyi diğerine kıyasla daha yüksek doğrulukla tahmin etmesine yol açacaktır. Tutarlı sonuçlar elde etmek için en az görüntüsü olan nesne ile en çok görüntüsü olan nesne arasında en az 1:2 oranınız olması gerekir. Örneğin en fazla görüntüye sahip olan nesnenin 500 görüntüsü varsa, en az görüntüye sahip olan nesnenin eğitim için en az 250 görüntüsü olmalıdır.

Birbirinden farklı görüntüler kullanın

Normal kullanım sırasında modele gönderilebilecek olan görüntülere yakın görüntüler sağlayın. Örneğin elmaları tanıyan bir model eğittiğinizi düşünelim. Eğitimde yalnızca tabaktaki elmaların görüntülerini kullanırsanız, modeliniz ağaçlardaki elmalarla ilgili doğru tahminlerde bulunamayabilir. Modelinizde sapma olmaması ve modelin genelleştirme yapabilmesi için birbirinden farklı türde görüntüler kullanmaya dikkat edin. Aşağıda, eğitim kümenizin çeşitliliğini artırmak için kullanabileceğiniz yöntemler verilmiştir.

Arka plan

Nesnelerinizin, arka planları farklı olan görüntülerini kullanın. Örneğin tabaktaki, eldeki ve ağaçtaki meyve. Bağlam içindeki fotoğraflar, sınıflandırıcı için daha fazla bilgi sağladığından nötr arka plana sahip olan fotoğraflardan daha iyidir.

Görüntü arka planları.

Işık

Farklı ışığa sahip eğitim görüntüleri kullanın. Bu durum özellikle tahmin için kullanılan görüntülerin farklı ışığa sahip olması durumunda önemlidir. Örneğin flaşla çekilmiş, yüksek pozlamaya sahip olan ve benzeri resimleri ekleyin. Ayrıca doygunluk, renk tonu ve parlaklık açısından farklı görüntüler sağlamak da faydalı olacaktır. Cihazınızın kamerası muhtemelen bu ayarları denetlemenize imkan tanıyacaktır.

Görüntü ışığı.

Nesne boyutu

Nesnelerin farklı boyutlarda olduğu ve nesnenin farklı bölümlerini yakalayan görüntüler sağlayın. Örneğin, muz salkımlarını gösteren bir fotoğrafı ve tek bir muzun yakın çekim fotoğrafı. Farklı boyutlar, modelin daha iyi genelleştirmesine yardımcı olur.

Nesne boyutları.

Kamera açısı

Farklı açılardan çekilmiş görüntüleri sağlamayı deneyin. Fotoğraflarınızın tamamı sabit kameralarla (güvenlik kameraları gibi) çekilmişse her kameraya ayrı bir etiket atayın. Bu işlem, ilgisiz nesnelerin (aydınlatma direkleri gibi) temel özellik olarak modellenmesinin engellenmesine yardımcı olabilir. Kameralar aynı nesneleri çekiyor olsalar bile kamera etiketleri ekleyin.

Kamera açıları.

Beklenmeyen sonuçlar

Yapay zeka modelleri görüntülerinizin ortak özelliklerini hatalı bir şekilde öğrenebilir. Örneğin, elmalarla limonları ayıracak bir model oluşturmak istediğinizi düşünelim. Elde tutulan elmalarla beyaz tabaklarda sunulan limonların görüntülerini kullanırsanız model, elmalarla limonlar yerine ellerle beyaz tabaklar için eğitilebilir.

Beklenmeyen sonuçlar.

Bunu düzeltmek için yukarıdaki görüntü çeşitliliği yönergelerini uygulayın ve farklı açılara, arka planlara, nesne boyutlarına, gruplara ve diğer özelliklere sahip görüntüler sağlayın.

Nesne algılamayı kullanmaya başlama