Scegliere le immagini appropriate per il training dell'intelligenza artificiale

Completato

Ora viene la parte più complicata, perché è necessario che gli utenti facciano le opportune considerazioni. Occorre scegliere il set di immagini più appropriato per rappresentare un oggetto. Come indicato nell'unità precedente, le immagini dovrebbero includere tutte l'oggetto, ma essere diverse in relazione a:

  • Angolazione della fotocamera
  • Illuminazione
  • Background
  • Stile visivo
  • Soggetti singoli/raggruppati
  • Dimensione
  • Tipo (se applicabile all'oggetto)

Per questo modulo, l'esempio userà immagini di Bungee tratte dal film Over the Moon. L'utente sceglierà le immagini che preferisce. Se vuole, può anche scattare delle foto. Scegliere l'animale domestico preferito (o anche uno di peluche) e scattare circa 30 foto. Tenere presente tutte le indicazioni fornite nell'elenco precedente.

Altri aspetti da considerare quando si scattano le foto o si cercano le immagini da usare:

  • Devono essere in uno dei formati seguenti: jpg, png, bmp o gif.
  • Non devono avere dimensioni maggiori di 6 MB.
  • Non devono contenere meno di 256 pixel sul lato più corto.

Sarà anche necessario trovare o creare un set di immagini da usare per testare l'intelligenza artificiale. Queste immagini di stima non devono essere usate per il training del servizio Visione personalizzata. Devono rispettare le stesse indicazioni, ad eccezione del fatto che le immagini di stima non devono essere di dimensioni superiori a 4 MB.

È consigliabile dedicare del tempo alla ricerca o alla creazione delle immagini. La creatività è importante! Scattare alcune foto con sfondo trasparente, altre solo con l'oggetto da diverse angolazioni e altre ancora in cui l'oggetto è piccolo. In questo modo, sarà più facile che il servizio apprenda quello che si vuole che sia in grado di identificare.

Etica del riconoscimento di immagini

A questo punto del modulo, è opportuno chiarire alcuni punti in materia di etica. Come con qualsiasi altra tecnologia, l'etica deve avere sempre un ruolo di primo piano rispetto alle soluzioni realizzate. Anche se si fa solo un esperimento o si prova qualche funzionalità, è opportuno considerare le implicazioni di quello che si sta facendo e quali ripercussioni può avere sugli altri.

Non bisogna dimenticare che Fei Fei ha creato un razzo per volare sulla Luna nel tentativo di riavvicinare la sua famiglia.

Image that shows Fei Fei sitting at the dinner table with her family during the Moon Festival.

Quando si scelgono le immagini, verificare che rappresentino effettivamente quello che è l'oggetto, lasciando da parte i pregiudizi e cercando di essere inclusivi. Essere etici e aperti nel mondo dei computer non vuol dire necessariamente risolvere ogni possibile versione di un problema. Si tratta piuttosto di rappresentare in modo appropriato il problema che si sta risolvendo.

Ecco un esempio:

Si supponga di aver scelto di eseguire il training del servizio Visione personalizzata per identificare gli ingressi degli edifici, in modo da poter aggiungere queste informazioni su una mappa creata da una fotocamera che fotografa gli esercizi commerciali che danno sulla strada. Le immagini incluse prevedevano scale e rampe ed erano al livello del terreno. Se le stime create successivamente per una nuova parte della città usando questo servizio di intelligenza artificiale sottoposto a training sono state incluse automaticamente nella mappa come ingressi praticabili, potrebbe non essere vero per tutti. In base alle informazioni fornite, gli utenti potrebbero pensare che un esercizio commerciale sia accessibile dalla strada. Ma quando arriva un utente che ha bisogno di una rampa, potrebbe trovarsi di fronte a un ingresso che prevede solo le scale.

È comunque possibile realizzare questo stesso identico modello, assicurandosi tuttavia che nell'app delle mappe sia indicato in modo appropriato che non è garantita la presenza di una rampa quando sono presenti le scale. O ancora meglio, essendo già previste le rampe nell'ambito del set di dati di training, si potrebbe includere un contrassegno per le rampe e consentire agli utenti di scegliere esplicitamente i tipi di ingressi praticabili che sono in grado di usare.

Prima di andare avanti con questo modulo, è opportuno considerare con attenzione le immagini da acquisire e pensare che sarà un servizio di intelligenza artificiale non umano e non empatico a prendere decisioni per conto dell'utente. Ipotizzare gli scenari peggiori e decidere come si intende gestirli. Anche se questa attività è un "semplice esperimento", essere sempre attenti e tenere in considerazione questi aspetti etici consentirà di tenerli sempre presenti spontaneamente quando si realizza qualcosa che potrebbe influire significativamente sulla vita di altre persone.