Vlastní kategorie (Preview)

Azure AI Content Safety umožňuje vytvářet a spravovat vlastní kategorie kon režim stanu ration pro rozšířené moderování a filtrování, které odpovídají vašim konkrétním zásadám nebo případům použití.

Typy přizpůsobení

Existuje několik způsobů, jak definovat a používat vlastní kategorie, které jsou podrobně popsány a porovnány v této části.

rozhraní API Funkce
Vlastní kategorie (standardní) rozhraní API Pomocí přizpůsobitelného modelu strojového učení můžete vytvořit, získat, dotazovat a odstranit přizpůsobenou kategorii. Nebo můžete zobrazit seznam všech přizpůsobených kategorií pro další poznámkové úkoly.
Vlastní kategorie (rychlé) rozhraní API Pomocí rozsáhlého jazykového modelu (LLM) můžete rychle zjistit konkrétní vzory obsahu při vznikajících incidentech obsahu.

Vlastní kategorie (standardní) rozhraní API

Rozhraní API vlastních kategorií (standard) umožňuje zákazníkům definovat kategorie specifické pro jejich potřeby, poskytovat ukázková data, trénovat vlastní model strojového učení a používat ho ke klasifikaci nového obsahu podle naučených kategorií.

Toto je standardní pracovní postup pro přizpůsobení pomocí modelů strojového učení. V závislosti na kvalitě trénovacích dat může dosáhnout velmi dobrých úrovní výkonu, ale trénování modelu může trvat až několik hodin.

Tato implementace funguje s textovým obsahem, nikoli s obsahem obrázku.

Vlastní kategorie (rychlé) rozhraní API

Rozhraní API vlastních kategorií (rychlé) je navržené tak, aby bylo rychlejší a flexibilnější než standardní metoda. Je určená k identifikaci, analýze, vymýcení a zotavení z kybernetických incidentů, které zahrnují nevhodný nebo škodlivý obsah na online platformách.

Incident může zahrnovat sadu vznikajících vzorů obsahu (text, obrázek nebo jiné způsoby), které porušují pokyny komunity Microsoftu nebo vlastní zásady a očekávání zákazníků. Tyto incidenty je potřeba rychle a přesně zmírnit, aby nedocházelo k potenciálním problémům s živými weby nebo škodám uživatelům a komunitám.

Tato implementace pracuje s textovým obsahem a obsahem obrázku.

Tip

Jedním ze způsobů, jak řešit nově vznikající incidenty obsahu, je použití seznamů blokovaných položek, ale to umožňuje pouze přesné porovnávání textu a porovnávání obrázků. Rozhraní API pro vlastní kategorie (rychlé) nabízí následující pokročilé funkce:

  • sémantické porovnávání textu pomocí vyhledávání vkládání s jednoduchým klasifikátorem
  • porovnávání obrázků s jednoduchým modelem pro sledování objektů a vkládáním hledání.

Jak to funguje

Funkce vlastních kategorií zabezpečení obsahu Azure AI používá vícekrokový proces pro vytváření, trénování a používání vlastních modelů klasifikace obsahu. Tady je přehled pracovního postupu:

Krok 1: Definice a nastavení

Když definujete vlastní kategorii, musíte naučit AI, jaký typ obsahu chcete identifikovat. To zahrnuje poskytnutí jasného názvu kategorie a podrobné definice , která zapouzdřuje charakteristiky obsahu.

Pak shromáždíte vyváženou datovou sadu s pozitivními a (volitelně) negativními příklady, které umělé inteligenci pomohou naučit se nuancemi vaší kategorie. Tato data by měla reprezentovat celou řadu obsahu, se kterým se model setká v reálném scénáři.

Krok 2: Trénování modelu

Po přípravě datové sady a definování kategorií služba Azure AI Content Safety trénuje nový model strojového učení. Tento model používá definice a nahranou datovou sadu k rozšíření dat pomocí velkého jazykového modelu. V důsledku toho se trénovací datová sada zvětší a zkvalitní. Během trénování model AI analyzuje data a učí se rozlišovat mezi obsahem, který je v souladu se zadanou kategorií a obsahem, který ne.

Krok 3: Odvozování modelu

Po trénování musíte model vyhodnotit, abyste měli jistotu, že splňuje vaše požadavky na přesnost. Otestujte model s novým obsahem, který ještě nepřijal. Fáze vyhodnocení vám pomůže identifikovat případné úpravy, které potřebujete k nasazení modelu do produkčního prostředí.

Krok 4: Využití modelu

Pomocí rozhraní API analyzeCustomCategory můžete analyzovat textový obsah a určit, jestli odpovídá vlastní kategorii, kterou jste definovali. Služba vrátí logickou hodnotu označující, jestli se obsah shoduje se zadanou kategorií.

Omezení

Dostupnost jazyka

Rozhraní API vlastních kategorií podporují všechny jazyky, které jsou podporovány moderováním textu zabezpečení obsahu. Viz Podpora jazyků.

Omezení vstupu

Omezení vstupu vlastního rozhraní API (standard) najdete v následující tabulce:

Object Omezení
Podporované jazyky Pouze angličtina
Počet kategorií na uživatele 3
Počet verzí na kategorii 3
Počet souběžných sestavení (procesů) na kategorii 0
Operace odvození za sekundu 5
Počet vzorků ve verzi kategorie Pozitivní vzorky(povinné): minimálně 50, maximálně 5 KB
Celkem (negativní i pozitivní vzorky): 10 tisíc
Nejsou povoleny žádné duplicitní vzorky.
Velikost ukázkového souboru maximálně 128000 bajtů
Délka ukázky textu maximálně 125 tisíc znaků
Délka definice kategorie maximálně 1000 znaků
Délka názvu kategorie maximálně 128 znaků
Délka adresy URL objektu blob maximálně 500 znaků