Supporto della lingua di analisi del sentiment e opinion mining

Usare questo articolo per informazioni sulle lingue supportate da analisi del sentiment e opinion mining. Sia l'API basata sul cloud che i contenitori Docker supportano le stesse lingue.

Supporto della lingua di analisi del sentiment

Codici linguistici supportati in totale: 94

Lingua Codice lingua Note
Afrikaans af
Albanese sq
Amharico am
arabo ar
Armeno hy
Assamese as
Azero az
Basco eu
Bielorussa (nuovo) be
Bengalese bn
Bosniaco bs
Bretone (nuovo) br
Bulgaro bg
Birmano my
Catalano ca
Cinese semplificato zh-hans Accettato anche zh
Cinese tradizionale zh-hant
Croato hr
Ceco cs
Danese da
Olandese nl
Inglese en
Esperanto (nuovo) eo
Estone et
Pilipino fil
Finlandese fi
Francese fr
Galiziano gl
Georgiano ka
Tedesco de
Greco el
Gujarati gu
Hausa (nuovo) ha
Ebraico he
Hindi hi
Ungherese hu
Indonesiano id
Irlandese ga
Italiano it
Giapponese ja
Giavanese (nuovo) jv
Kannada kn
Kazako kk
Khmer km
Coreano ko
Curdo (Kurmanji) ku
Kirghiso ky
Lao lo
Latino (nuovo) la
Lettone lv
Lituano lt
Macedone mk
Malgascio mg
Malese ms
Malayalam ml
Marathi mr
Mongolo mn
Nepalese ne
Norvegese no
Odia or
Oromo (nuovo) om
Pashto ps
Persiano fa
Polacco pl
Portoghese (Portogallo) pt-PT Accettato anche pt
Portoghese (Brasile) pt-BR
Punjabi pa
Romeno ro
Russo ru
Sanscrito (nuovo) sa
Scozzese Gaelico (nuovo) gd
Serbo sr
Sindhi (nuovo) sd
Sinhala (nuovo) si
Slovacco sk
Sloveno sl
Somalo so
Spagnolo es
Sundanese (nuovo) su
Swahili sw
Svedese sv
Tamil ta
Telugu te
Thai th
Turco tr
Ucraino uk
Urdu ur
Uiguro ug
Uzbeco uz
Vietnamita vi
Gallese cy
Frisone occidentale (nuovo) fy
Xhosa (nuovo) xh
Yiddish (nuovo) yi

Supporto del linguaggio di opinion mining

Codici linguistici supportati in totale: 94

Lingua Codice lingua Note
Afrikaans (nuovo) af
Albanese (nuovo) sq
Amarico (nuovo) am
arabo ar
Armeno (nuovo) hy
Assamese (nuovo) as
Azerbaigiano (nuovo) az
Basco (nuovo) eu
Bielorussa (nuovo) be
Bengalese bn
Bosniaco (nuovo) bs
Bretone (nuovo) br
Bulgaro (nuovo) bg
Burmese (nuovo) my
Catalano (nuovo) ca
Cinese semplificato zh-hans Accettato anche zh
Cinese (tradizionale) (nuovo) zh-hant
Croato (nuovo) hr
Ceco (nuovo) cs
Danese da
Olandese nl
Inglese en
Esperanto (nuovo) eo
Estone (nuovo) et
Filippino (nuovo) fil
Finlandese fi
Francese fr
Galiziano (nuovo) gl
Georgiano (nuovo) ka
Tedesco de
Greco el
Gujarati (nuovo) gu
Hausa (nuovo) ha
Ebraico (nuovo) he
Hindi hi
Ungherese hu
Indonesiano id
Irlandese (nuovo) ga
Italiano it
Giapponese ja
Giavanese (nuovo) jv
Kannada (nuovo) kn
Kazako (nuovo) kk
Khmer (nuovo) km
Coreano ko
Curdo (Kurmanji) ku
Kirghiso (nuovo) ky
Lao (nuovo) lo
Latino (nuovo) la
Lettone (nuovo) lv
Lituano (nuovo) lt
Macedone (nuovo) mk
Malgascio (nuovo) mg
Malese (nuovo) ms
Malayalam (nuovo) ml
Marathi mr
Mongolo (nuovo) mn
Nepalese (nuovo) ne
Norvegese no
Odia (novità) or
Oromo (nuovo) om
Pashto (nuovo) ps
Persiano (novità) fa
Polacco pl
Portoghese (Portogallo) pt-PT Accettato anche pt
Portoghese (Brasile) pt-BR
Punjabi (nuovo) pa
Romeno (nuovo) ro
Russo ru
Sanscrito (nuovo) sa
Scozzese Gaelico (nuovo) gd
Serbo (nuovo) sr
Sindhi (nuovo) sd
Sinhala (nuovo) si
Slovacco (nuovo) sk
Sloveno (nuovo) sl
Somalo (nuovo) so
Spagnolo es
Sundanese (nuovo) su
Swahili (nuovo) sw
Svedese sv
Tamil ta
Telugu te
Thailandese (nuovo) th
Turco tr
Ucraino (nuovo) uk
Urdu (nuovo) ur
Uiguro (nuovo) ug
Uzbeko (nuovo) uz
Vietnamita (nuovo) vi
Gallese (nuovo) cy
Frisone occidentale (nuovo) fy
Xhosa (nuovo) xh
Yiddish (nuovo) yi

Opzione multilingue (solo analisi valutazione personalizzata)

Con l'analisi valutazione personalizzata, è possibile eseguire il training di un modello in una lingua e usarlo per classificare documenti in un'altra lingua. Questa funzionalità è utile perché consente di risparmiare tempo e lavoro. Anziché compilare progetti separati per ogni lingua, è possibile gestire un set di dati multilingue in un unico progetto. Il set di dati non deve essere interamente nella stessa lingua, ma è necessario abilitare l'opzione multilingue per il progetto durante la creazione o successivamente nelle impostazioni del progetto. Se si nota che le prestazioni del modello sono scarse in determinate lingue durante il processo di valutazione, valutare l’aggiunta di altri dati in queste lingue al set di training.

È possibile eseguire il training del progetto con documenti tutti in inglese ed eseguirne query in: francese, tedesco, mandarino, giapponese, coreano e altre lingue. L'analisi valutazione personalizzata semplifica la scalabilità dei progetti in più lingue usando una tecnologia multilingue per il training dei modelli.

Ogni volta che si rileva che le prestazioni per una determinata lingua non sono soddisfacenti come per altre lingue, è possibile aggiungere altri documenti per tale lingua nel progetto.

Non è previsto che si aggiunga lo stesso numero di documenti per ogni lingua. È preferibile creare la maggior parte del progetto in un’unica lingua e aggiungere solo alcuni documenti nelle lingue le cui prestazioni sono insoddisfacenti. Se si crea un progetto principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe rilevare che le prestazioni per il tedesco non sono soddisfacenti come per le altre due lingue. In tal caso, valutare l’aggiunta del 5% dei documenti originali in inglese in tedesco, eseguire il training di un nuovo modello e ripetere i test per il tedesco. In tal modo, i risultati per le query in tedesco dovrebbero migliorare. Maggiore è il numero di documenti etichettati aggiunti, maggiori sono le probabilità di ottenere risultati migliori.

Quando si aggiungono dati in un'altra lingua, non è previsto un impatto negativo su altre lingue.

Passaggi successivi