Migliorare le prestazioni del modello di classificazione categoria
Se il punteggio delle prestazioni del modello non è quello desiderato, è possibile provare a modificare qualcosa. Questi suggerimenti consentono di perfezionare il modello e migliorarne la capacità predittiva.
Aggiungere dati di training etichettati più correttamente
Più dati di addestramento sono correttamente etichettati, migliore sarà il rendimento del modello. Ad esempio, supponiamo che tu abbia un'etichetta Sì/No. Se la maggior parte dei dati ha solo Sì in questa colonna, è probabile che il modello di intelligenza artificiale non apprenda molto da questi dati. Se i tuoi dati non sono correttamente etichettati, il modello probabilmente non apprenderà molto bene. L'ideale sarebbe iniziare con un piccolo set di esempi correttamente etichettati, forse 100 o meno. Da lì, puoi continuare a raddoppiare il numero di esempi in modo iterativo e ripetere il training ogni volta, prendendo nota del cambiamento delle prestazioni. In generale, è meglio raccogliere un numero maggiore di dati, ma i risultati diminuiscono aggiungendo dati mentre il set di dati diventa più grande.
Altri suggerimenti
- Verifica di aver bilanciato l'utilizzo dei tag nei dati di training. Ad esempio: hai quattro tag per 100 elementi di testo. I due primi tag (tag1 e tag2) vengono utilizzati per 90 elementi di testo, ma gli altri due (tag3 e Tag4) vengono utilizzati solo sui restanti 10 elementi di testo. La mancanza di bilanciamento potrebbe causare difficoltà nel predire correttamente il modello tag3 o Tag4.
- Assicurati di eseguire il training del tuo modello utilizzando dati simili a quelli per i quali prevedi di utilizzare il modello.
Passaggio successivo
Pubblicare il modello di classificazione categoria