Standardprinciper för innehållssäkerhet

Artikel
09/02/2024

Azure OpenAI Service innehåller standardsäkerhet som tillämpas på alla modeller, exklusive Azure OpenAI Whisper. De här konfigurationerna ger dig en ansvarsfull upplevelse som standard, inklusive modeller för innehållsfiltrering, blocklistor, prompttransformering, autentiseringsuppgifter för innehåll och andra.

Standardsäkerhet syftar till att minska risker som hat och rättvisa, sexuellt, våld, självskadebeteende, skyddat materialinnehåll och användarinmatningsattacker. Mer information om innehållsfiltrering finns i vår dokumentation som beskriver kategorier och allvarlighetsnivåer här.

All säkerhet kan konfigureras. Mer information om konfigurerbarhet finns i vår dokumentation om hur du konfigurerar innehållsfiltrering.

Textmodeller: GPT-4, GPT-3.5

Textmodeller i Azure OpenAI-tjänsten kan ta in och generera både text och kod. Dessa modeller använder Azures modeller för textinnehållsfiltrering för att identifiera och förhindra skadligt innehåll. Det här systemet fungerar både när du frågar och slutför.

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medium
Våld	Frågor och slutföranden	Medium
Sexuell	Frågor och slutföranden	Medium
Självskadebeteende	Frågor och slutföranden	Medium
Användarinmatningsattack (Jailbreak)	Uppmanas	Ej tillämpligt
Skyddat material – text	Kompletteringar	Ej tillämpligt
Skyddat material – kod	Kompletteringar	Ej tillämpligt

Visionsmodeller: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o och GPT-4 Turbo

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medium
Våld	Frågor och slutföranden	Medium
Sexuell	Frågor och slutföranden	Medium
Självskadebeteende	Frågor och slutföranden	Medium
Identifiering av individer och slutsatsdragning av känsliga attribut	Uppmanas	Ej tillämpligt
Användarinmatningsattack (Jailbreak)	Uppmanas	Ej tillämpligt

DALL-E 3 och DALL-E 2

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Låg
Våld	Frågor och slutföranden	Låg
Sexuell	Frågor och slutföranden	Låg
Självskadebeteende	Frågor och slutföranden	Låg
Autentiseringsuppgifter för innehåll	Kompletteringar	Ej tillämpligt
Bedräglig generation av politiska kandidater	Uppmanas	Ej tillämpligt
Skildringar av offentliga figurer	Uppmanas	Ej tillämpligt
Användarinmatningsattack (Jailbreak)	Uppmanas	Ej tillämpligt
Skyddat material – Konst och Studio-tecken	Uppmanas	Ej tillämpligt
Olämpligt språk	Uppmanas	Ej tillämpligt

Utöver ovanstående säkerhetskonfigurationer levereras Azure OpenAI DALL-E också med snabbomvandling som standard. Denna omvandling sker på alla uppmaningar för att förbättra säkerheten för din ursprungliga uppmaning, särskilt i riskkategorierna för mångfald, bedräglig generation av politiska kandidater, skildringar av offentliga personer, skyddat material och andra.

Dela via

Standardprinciper för innehållssäkerhet

Textmodeller: GPT-4, GPT-3.5

Visionsmodeller: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o och GPT-4 Turbo

DALL-E 3 och DALL-E 2

Feedback

Ytterligare resurser