Hodnocení výslovnosti v AI Studiu

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Hodnocení výslovnosti používá řeč na text schopnost poskytovat subjektivní a objektivní zpětnou vazbu pro žáky jazyka. Cvičení výslovnosti a včasné zpětné vazby jsou nezbytné pro zlepšení jazykových dovedností. Hodnocení založená zkušenými učiteli mohou zabrat mnoho času a úsilí a vysoce kvalitní hodnocení pro žáky. Hodnocení výslovnosti může pomoct, aby bylo hodnocení jazyka poutavější a přístupnější pro žáky všech pozadí.

Poznámka:

Informace o dostupnosti hodnocení výslovnosti najdete v podporovaných jazycích a dostupných oblastech.

Tento článek popisuje, jak používat nástroj pro posouzení výslovnosti bez psaní kódu prostřednictvím AI Studia. Informace o tom, jak integrovat hodnocení výslovnosti v aplikacích pro řeč, najdete v tématu Jak používat hodnocení výslovnosti.

Scénáře čtení a mluvení

Pro hodnocení výslovnosti existují dva scénáře: čtení a mluvení.

  • Čtení: Tento scénář je určený pro skriptované posouzení. Vyžaduje, aby si studenti přečetli daný text. Referenční text je k dispozici předem.
  • Mluvení: Tento scénář je určený pro neskriptované hodnocení. Vyžaduje, aby studenti mluvili o daném tématu. Referenční text není k dispozici předem.

Provedení skriptovaného posouzení

Pokud chcete vyhodnotit výslovnost referenčního textu, postupujte takto:

  1. Přejděte do hodnocení výslovnosti v AI Studiu.

    Snímek obrazovky znázorňuje, jak přejít k hodnocení výslovnosti v AI Studiu

  2. Na kartě Čtení zvolte podporovaný jazyk , který chcete vyhodnocovat výslovnost.

    Snímek obrazovky s výběrem podporovaného jazyka na kartě čtení, kterou chcete vyhodnocovat výslovnost

  3. Můžete použít zřízené textové ukázky nebo zadat vlastní skript.

    Při čtení textu byste měli být blízko mikrofonu, abyste měli jistotu, že nahraný hlas není příliš nízký.

    Snímek obrazovky, kde nahrát zvuk pomocí mikrofonu na kartě čtení

    V opačném případě můžete nahrát nahraný zvuk pro hodnocení výslovnosti. Po úspěšném nahrání se zvuk automaticky vyhodnotí systémem, jak je znázorněno na následujícím snímku obrazovky.

    Snímek obrazovky s nahráním nahraného zvuku, který se má posoudit

Provedení neoznačeného posouzení

Pokud chcete provést neoznačené hodnocení, vyberte kartu Mluvení. Tato funkce umožňuje provádět neoznačené hodnocení bez nutnosti předem poskytovat referenční text. Tady je postup, jak pokračovat:

  1. Přejděte do hodnocení výslovnosti v AI Studiu.

  2. Na kartě Mluvení zvolte podporovaný jazyk , který chcete vyhodnocovat výslovnost.

    Snímek obrazovky s výběrem podporovaného jazyka na kartě mluvení, který chcete vyhodnotit výslovnost

  3. Dále si můžete vybrat z ukázkových témat nebo zadat vlastní téma. Tato volba umožňuje vyhodnotit schopnost mluvit na daném předmětu bez předdefinovaného skriptu.

    Snímek obrazovky se zadáváním tématu na kartě Mluvení za účelem posouzení schopnosti mluvit na daném předmětu bez předdefinovaného skriptu

    Při nahrávání řeči pro hodnocení výslovnosti je důležité zajistit, aby čas nahrávání spadá do doporučeného rozsahu 15 sekund (odpovídá více než 50 slovům) až 10 minut. Tento časový rozsah je optimální pro přesné vyhodnocení obsahu řeči. Pokud chcete získat skóre tématu, mluvený zvuk by měl obsahovat aspoň tři věty.

    Můžete také nahrát nahraný zvuk pro hodnocení výslovnosti. Po úspěšném nahrání se zvuk automaticky vyhodnotí systémem.

Výsledky vyhodnocení výslovnosti

Po nahrání řeči nebo nahrání nahraného zvuku se výsledek posouzení zobrazí jako výstup . Výsledek zahrnuje mluvený zvuk a zpětnou vazbu k posouzení řeči. V případě potřeby si můžete poslechnout mluvený zvuk a stáhnout ho.

Můžete také zkontrolovat výsledek vyhodnocení výslovnosti ve formátu JSON. Skóre přesnosti na úrovni slova, slabiky a foonemu jsou součástí souboru JSON.

Snímek obrazovky znázorňující výsledek posouzení v okně zobrazení, který obsahuje přepis a zpětnou vazbu k vaší řeči

Slovo je zvýrazněno podle typu chyby. Typy chyb v hodnocení výslovnosti jsou reprezentovány různými barvami. Toto vizuální rozlišení usnadňuje identifikaci a analýzu konkrétních chyb. Poskytuje jasný přehled typů chyb a frekvencí v mluveném zvuku a pomáhá soustředit se na oblasti, které potřebují zlepšit. Jednotlivé typy chyb můžete zapnout nebo vypnout, abyste se mohli zaměřit na konkrétní typy chyb nebo vyloučit určité typy ze zobrazení. Tato funkce poskytuje flexibilitu při kontrole a analýze chyb v mluveném zvuku. Při najetí myší na každé slovo můžete zobrazit skóre přesnosti pro celé slovo nebo konkrétní fonely.

V dolní části výsledku posouzení se zobrazí výsledky vyhodnocování. Pro vyhodnocování výslovnosti skriptu je k dispozici pouze skóre výslovnosti (včetně skóre přesnosti, skóre fluency, skóre úplnosti a skóre prosody). U vyhodnocení výslovnosti bez popisků se zobrazí skóre výslovnosti (včetně skóre přesnosti, skóre fluency a skóre prosody) a skóre obsahu (včetně skóre slovníku, gramatického skóre a skóre tématu).

Členitost hodnocení výslovnosti

Posouzení výslovnosti poskytuje různé výsledky posouzení různých podrobností, od jednotlivých fonémů až po celý textový vstup.

  • Na úrovni fulltextu nabízí hodnocení výslovnosti další skóre Fluency, Completeness a Prosody: Fluency označuje, jak přesně řeč odpovídá použití tichých konců mezi slovy rodilého mluvčího; Úplnost označuje, kolik slov se v řeči vyslovuje pro odkazované textové zadání; Prosody označuje, jak dobře mluvčí vyjadřuje prvky přirozeného, výraznosti a celkové prosody ve své řeči. Celkové skóre agregované z přesnosti, plynulosti, úplnosti a prosody se pak dá indikovat celkovou kvalitu výslovnosti dané řeči. Hodnocení výslovnosti také nabízí skóre obsahu (slovník, gramatika a téma) na úrovni fulltextu.
  • Na úrovni slova může posouzení výslovnosti automaticky rozpoznat chybné vzorce a současně poskytovat skóre přesnosti, což poskytuje podrobnější informace o vynechání, opakování, vkládání a výslovnosti v dané řeči.
  • Skóre přesnosti na úrovni slabiky jsou aktuálně k dispozici prostřednictvím souboru JSON nebo sady Speech SDK.
  • Na úrovni výslovnosti výslovnost poskytuje skóre přesnosti každého fonemu, což pomáhá naučit se lépe porozumět podrobnostem výslovnosti jejich řeči.

Kromě standardních skóre přesnosti, plynulosti a úplnosti zahrnuje funkce hodnocení výslovnosti v AI Studiu komplexní skóre, která poskytují podrobnou zpětnou vazbu k různým aspektům výkonu řeči a porozumění. Vylepšené skóre jsou následující: skóre prosody, skóre slovníku, skóre gramatiky a skóre tématu. Tato skóre nabízejí cenné přehledy o prosody řeči, použití slovníku, správnosti gramatiky a porozumění tématům.

Snímek obrazovky s celkovým skóre výslovnosti a celkovým skóre obsahu v AI Studiu

V dolní části výsledku posouzení se zobrazí dvě celkové skóre: výslovnost a skóre obsahu. Na kartě Čtení najdete zobrazené skóre výslovnosti. Na kartě Mluvení se zobrazí skóre výslovnosti i skóre obsahu.

Skóre výslovnosti: Toto skóre představuje agregované hodnocení kvality výslovnosti a zahrnuje čtyři podspekty. Tato skóre jsou k dispozici na kartách pro čtení i mluvení pro skriptovaná i neoznamovaná hodnocení.

  • Skóre přesnosti: Vyhodnotí správnost výslovnosti.
  • Skóre plynulosti: Měří úroveň plynulosti a přirozeného chování řeči.
  • Skóre úplnosti: Odráží správný počet slov.
  • Skóre prosody: Vyhodnotí použití vhodné intonace, rytmu a stresu. Zavádí se několik dalších typů chyb souvisejících s posouzením prosody, například Neočekávaný konec, Chybějící konec a Monotone. Tyto typy chyb poskytují podrobnější informace o výslovnostech v porovnání s předchozím modulem.

Skóre obsahu: Toto skóre poskytuje agregované hodnocení obsahu řeči a zahrnuje tři dílčí body. Toto skóre je k dispozici pouze na kartě mluvení pro neoznačené hodnocení.

  • Skóre slovníku: Vyhodnocuje efektivní použití slov a jejich vhodnost v daném kontextu k přesnému vyjádření myšlenek a úrovně lexikální složitosti.
  • Skóre gramatiky: Vyhodnotí správnost použití gramatiky a různé vzory vět. Bere v úvahu lexikální přesnost, gramatickou přesnost a rozmanitost struktur vět a poskytuje komplexnější hodnocení jazykové odbornosti.
  • Skóre tématu: Vyhodnocuje úroveň porozumění a zapojení s tématem probíraným ve řeči. Vyhodnotí schopnost mluvčího efektivně vyjádřit myšlenky a nápady související s daným tématem.

Tato celková skóre nabízejí komplexní hodnocení výslovnosti i obsahu, které poskytuje posluchačům cennou zpětnou vazbu o různých aspektech výkonu a porozumění řeči. Díky těmto vylepšeným funkcím můžou studenti jazyků získat hlubší přehled o svých výhodách a oblastech pro zlepšení výslovnosti i výrazu obsahu.

Poznámka:

Hodnocení obsahu a prosody jsou k dispozici pouze v národním prostředí en-US .

Hodnocení skóre v režimu streamování

Posouzení výslovnosti podporuje režim nepřerušeného streamování. Ukázka AI Studia umožňuje pro vyhodnocení až 60 minut nahrávání v režimu streamování. Pokud nestisknete tlačítko zastavit nahrávání, proces vyhodnocení se nedokončí a hodnocení můžete pohodlně pozastavit a pokračovat v hodnocení.

Hodnocení výslovnosti vyhodnocuje několik aspektů výslovnosti. V dolní části výsledku posouzení můžete zobrazit skóre výslovnosti jako agregované celkové skóre, které zahrnuje 4 dílčí aspekty: skóre přesnosti, skóre fluency, skóre úplnosti a skóre Prosody. V režimu streamování se vzhledem k tomu, že skóre přesnosti, skóre fluency a skóre Prosody se v průběhu času během procesu nahrávání liší, předvedeme v AI Studiu přístup k zobrazení přibližného celkového skóre přírůstkově před koncem vyhodnocení, který vážil pouze skóre přesnosti, skóre fluency a skóre Prosody. Skóre úplnosti se počítá pouze na konci vyhodnocení po stisknutí tlačítka stop, takže konečné výslovnost se agreguje z skóre přesnosti, skóre fluency, completeness a skóre Prosody s hmotností.

Celý proces vyhodnocení výslovnosti v režimu streamování najdete v níže uvedených ukázkových příkladech.

Zahájení nahrávání

Při zahájení nahrávání se skóre v dolní části začnou měnit od 0.

Snímek obrazovky s celkovým skóre hodnocení při zahájení záznamu

Během nahrávání

Během nahrávání dlouhého odstavce můžete nahrávání kdykoli pozastavit. Nahrávání můžete dál vyhodnocovat, dokud nestisknete tlačítko Zastavit.

Snímek obrazovky s celkovým skóre hodnocení při nahrávání

Dokončení nahrávání

Po stisknutí tlačítka stop se v dolní části zobrazí skóre výslovnosti, skóre přesnosti, skóre fluency, skóre dokončení a skóre Prosody.

Snímek obrazovky s celkovými skóre hodnocení po nahrávání

Ceny

Jako směrný plán stojí využití hodnocení výslovnosti stejné jako převod řeči na text pro průběžné platby nebo ceny úrovně závazku. Pokud si koupíte úroveň závazku pro převod řeči na text, útrata za vyhodnocení výslovnosti se dostane ke splnění závazku.

Funkce hodnocení výslovnosti také nabízí další skóre, která nejsou zahrnutá v ceně základní řeči na text: prosody, gramatika, téma a slovní zásoba. Tato skóre jsou k dispozici jako doplňkové poplatky nad základní řeč na textovou cenu. Informace o cenách najdete v tématu o cenách převodu řeči na text.

Tady je tabulka dostupných skóre hodnocení výslovnosti, ať už je dostupná ve skriptovaných nebo neoznačeném hodnocení a jestli je zahrnutá do směrného plánu řeči na textovou cenu nebo doplňkovou cenu.

Skóre Skriptované nebo neoznačené Zahrnuté do směrného plánu řeči na textovou cenu?
Přesnost Skriptované a neoznačené Ano
Plynulost Skriptované a neoznačené Ano
Úplnost Scénář Ano
Miscue Skriptované a neoznačené Ano
Prozódie Skriptované a neoznačené No
Gramatika Pouze bez popisů No
Téma Pouze bez popisů No
Slovní zásoba Pouze bez popisů No

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také lidi, kteří ho používají, osoby, které ho budou ovlivněny, a prostředí, ve kterém je nasazené. Přečtěte si poznámky k transparentnosti a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech.

Další kroky