Trénování vlastního modelu klasifikace textu

Trénování je proces, při kterém se model učí z označených dat. Po dokončení trénování budete moct zobrazit výkon modelu a zjistit, jestli potřebujete model vylepšit.

Pokud chcete vytrénovat model, spusťte trénovací úlohu. Pouze úspěšně dokončené úlohy vytvoří použitelný model. Platnost trénovacích úloh vyprší po sedmi dnech. Po tomto období nebudete moct načíst podrobnosti úlohy. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, nebude to mít vliv na vypršení platnosti úlohy. Najednou můžete mít spuštěnou jenom jednu trénovací úlohu a nemůžete spustit jiné úlohy ve stejném projektu.

Časy trénování můžou být během několika minut při práci s několika dokumenty až několik hodin v závislosti na velikosti datové sady a složitosti schématu.

Požadavky

Než model vytrénujete, potřebujete:

Další informace najdete v životním cyklu vývoje projektu.

Rozdělování dat

Než začnete s procesem trénování, budou označené dokumenty v projektu rozdělené do trénovací sady a testovací sady. Každý z nich slouží jiné funkci. Trénovací sada se používá v trénování modelu. Jedná se o sadu, ze které se model učí třídy nebo třídy přiřazené k jednotlivým dokumentům. Testovací sada je nevidomá sada , která není součástí modelu během trénování, ale pouze během vyhodnocení. Jakmile se model úspěšně natrénuje, použije se k vytváření předpovědí z dokumentů v testovací sadě. Na základě těchto předpovědí se počítají metriky vyhodnocení modelu. Doporučuje se zajistit, aby všechny vaše třídy byly odpovídajícím způsobem reprezentovány v trénovací i testovací sadě.

Vlastní klasifikace textu podporuje dvě metody rozdělení dat:

  • Automatické rozdělení testovací sady z trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sady podle zvolených procent. Systém se pokusí mít ve vaší trénovací sadě reprezentaci všech tříd. Doporučené procento rozdělení je 80 % pro trénování a 20 % pro testování.

Poznámka:

Pokud zvolíte možnost Automatické rozdělení testovací sady z trénovacích dat , rozdělí se pouze data přiřazená k trénovací sadě podle zadaných procent.

  • Použijte ruční rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které označené dokumenty mají patřit do které sady. Tento krok je povolený jenom v případě, že jste do testovací sady přidali dokumenty během označování dat.

Trénování modelu

Zahájení trénování modelu v sadě Language Studio:

  1. V nabídce na levé straně vyberte Úlohy trénování .

  2. V horní nabídce vyberte Spustit trénovací úlohu .

  3. Vyberte Vytrénovat nový model a do textového pole zadejte název modelu. Existující model můžete také přepsat tak, že vyberete tuto možnost a zvolíte model, který chcete přepsat z rozevírací nabídky. Přepsání natrénovaného modelu je nevratné, ale nebude mít vliv na nasazené modely, dokud nový model nenasadíte.

    Vytvoření nové trénovací úlohy

  4. Vyberte metodu rozdělení dat. Můžete zvolit automatické rozdělení testovací sady z trénovacích dat , kde systém rozdělí označená data mezi trénovací a testovací sady podle zadaných procent. Nebo můžete použít ruční rozdělení trénovacích a testovacích dat, tato možnost je povolená jenom v případě, že jste do testovací sady přidali dokumenty během označování dat. Další informace o rozdělení dat najdete v tématu Postup trénování modelu .

  5. Vyberte tlačítko Trénovat.

  6. Pokud v seznamu vyberete ID trénovací úlohy, zobrazí se boční podokno, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti o této úloze.

    Poznámka:

    • Pouze úspěšně dokončené trénovací úlohy vygenerují modely.
    • Doba trénování modelu může trvat od několika minut do několika hodin na základě velikosti označených dat.
    • Najednou můžete mít spuštěnou pouze jednu úlohu trénování. V rámci stejného projektu nemůžete spustit další úlohu trénování, dokud se nedokončí spuštěná úloha.

Zrušení trénovací úlohy

Pokud chcete zrušit trénovací úlohu v sadě Language Studio, přejděte na stránku Školicí úlohy . Vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .

Další kroky

Po dokončení trénování budete moct zobrazit výkon modelu, abyste v případě potřeby mohli model volitelně vylepšit. Jakmile budete s modelem spokojeni, můžete ho nasadit a zpřístupnit ho ke klasifikaci textu.