Rozhraní REST API pro převod řeči na text

Rozhraní REST API pro převod řeči na text se používá k dávkovému přepisu a vlastní řeči.

Důležité

Rozhraní REST API pro převod řeči na text verze 3.2 je obecně dostupná nejnovější verze. Verze Preview 3.2-preview.1 a 3.2-preview.2* budou odebrány v září 2024. Rozhraní REST API pro převod řeči na text verze 3.1 bude vyřazeno k datu, které se má oznámit. Další informace o upgradu najdete v průvodci migrací rozhraní REST API pro převod řeči na text v3.1 na verzi 3.2 . Rozhraní REST API pro převod řeči na text verze 3.0 bude vyřazeno 1. dubna 2026. Další informace o upgradu najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1 a v3.1 na verzi 3.2 .

Použití služby Speech k textovému rozhraní REST API pro:

  • Rychlý přepis: Přepis zvukových souborů se synchronně vrací výsledky a mnohem rychleji než zvuk v reálném čase. Rozhraní API pro rychlý přepis (/speechtotext/přepisy:přepis) použijte ve scénářích, které potřebujete co nejrychleji přepis zvukového záznamu s předvídatelnou latencí, jako je například rychlý přepis zvuku nebo video transkripce nebo překlad videa.
  • Vlastní řeč: Nahrajte vlastní data, otestujte a vytrénujte vlastní model, porovnejte přesnost mezi modely a nasaďte model do vlastního koncového bodu. Pokud chcete, aby kolegové měli přístup k vytvořenému modelu nebo pokud chcete model nasadit do více než jedné oblasti, zkopírujte modely do jiných předplatných.
  • Dávkový přepis: Přepis zvukových souborů jako dávky z několika adres URL nebo kontejneru Azure.

Rozhraní REST API pro převod řeči na text zahrnuje například tyto funkce:

  • Pokud jsou pro tento koncový bod požadovány protokoly, získejte protokoly pro každý koncový bod.
  • Požádejte manifest modelů, které vytvoříte, a nastavte místní kontejnery.
  • Nahrajte data z účtů úložiště Azure pomocí identifikátoru URI sdíleného přístupového podpisu (SAS).
  • Přineste si vlastní úložiště. Pro protokoly, soubory přepisu a další data použijte vlastní účty úložiště.
  • Některé operace podporují oznámení webhooků. Můžete zaregistrovat webhooky, kde se odesílají oznámení.

Dávkový přepis

Pro dávkový přepis platí následující skupiny operací.

Skupina operací Popis
Modely K přepisu zvukových souborů použijte základní modely nebo vlastní modely.

Modely můžete používat s vlastní řečí a dávkovým přepisem. K přepisu zvukových souborů můžete například použít model natrénovaný s konkrétní datovou sadou. Příklady trénování a správy vlastních modelů řeči najdete v tématu Trénování modelu a životního cyklu vlastního modelu řeči.
Přepisy Přepisy slouží k přepisu velkého množství zvuku v úložišti.

Při použití dávkového přepisu odešlete více souborů na požadavek nebo nasměrujete do kontejneru služby Azure Blob Storage se zvukovými soubory, které se mají přepisovat. Příklady vytvoření přepisu z více zvukových souborů najdete v tématu Vytvoření přepisu .
Webhooky Pomocí webhooků můžete dostávat oznámení o událostech vytváření, zpracování, dokončování a odstraňování.

Webhooky můžete používat s vlastní řečí a dávkovým přepisem. Webové hooky se vztahují na datové sady, koncové body, vyhodnocení, modely a přepisy.

Vlastní řeč

Následující skupiny operací platí pro vlastní řeč.

Skupina operací Popis
Datové sady Pomocí datových sad můžete trénovat a testovat vlastní modely řeči.

Můžete například porovnat výkon vlastní řeči natrénované s konkrétní datovou sadou s výkonem základního modelu nebo vlastního speech modelu natrénovaného s jinou datovou sadou. Příklady nahrávání datových sad najdete v tématu Nahrání trénovacích a testovacích datových sad.
Koncové body Nasaďte vlastní modely řeči do koncových bodů.

Pokud chcete použít vlastní model řeči , musíte nasadit vlastní koncový bod. Příklady správy koncových bodů nasazení najdete v tématu Nasazení modelu .
Evakuace Pomocí vyhodnocení můžete porovnat výkon různých modelů.

Můžete například porovnat výkon vlastního modelu řeči natrénovaného s konkrétní datovou sadou s výkonem základního modelu nebo vlastního modelu natrénovaného s jinou datovou sadou. Příklady, jak testovat a vyhodnotit vlastní modely řeči, najdete v tématu o kvalitě rozpoznávání testů a přesnosti testů.
Modely K přepisu zvukových souborů použijte základní modely nebo vlastní modely.

Modely můžete používat s vlastní řečí a dávkovým přepisem. K přepisu zvukových souborů můžete například použít model natrénovaný s konkrétní datovou sadou. Příklady trénování a správy vlastních modelů řeči najdete v tématu Trénování modelu a životního cyklu vlastního modelu řeči.
Projekty Pomocí projektů můžete spravovat vlastní modely řeči, trénovací a testovací datové sady a koncové body nasazení.

Vlastní projekty řeči obsahují modely, trénovací a testovací datové sady a koncové body nasazení. Každý projekt je specifický pro národní prostředí. Můžete například vytvořit projekt pro angličtinu v USA. Příklady vytvoření projektů najdete v tématu Vytvoření projektu .
Webhooky Pomocí webhooků můžete dostávat oznámení o událostech vytváření, zpracování, dokončování a odstraňování.

Webhooky můžete používat s vlastní řečí a dávkovým přepisem. Webové hooky se vztahují na datové sady, koncové body, vyhodnocení, modely a přepisy.

Stav služeb

Stav služby poskytuje přehled o celkovém stavu služby a dílčích součástech. Další informace najdete v tématu Service Health .

Další kroky