Criteri di sicurezza dei contenuti predefiniti

Articolo
09/03/2024

Servizio OpenAI di Azure include la sicurezza predefinita applicata a tutti i modelli, escluso Whisper di Azure OpenAI. Queste configurazioni offrono un'esperienza responsabile per impostazione predefinita, tra cui modelli di filtro dei contenuti, elenchi di elementi bloccati, trasformazione di prompt, credenziali del contenuto e altro ancora.

La sicurezza predefinita mira a mitigare i rischi di odio e slealtà, sesso, violenza, autolesionismo, contenuti di materiali protetti e attacchi di prompt injection degli utenti. Per altre informazioni sul filtro dei contenuti, visitare la documentazione che descrive le categorie e i livelli di gravità qui.

Tutta la sicurezza è configurabile. Per altre informazioni sulla configurabilità, visitare la documentazione sulla configurazione del filtro dei contenuti.

Modelli di testo: GPT-4, GPT-3.5

I modelli di testo nel Servizio Azure OpenAI possono accettare e generare testo e codice. Tali modelli usano i modelli di filtro dei contenuti di testo di Azure per rilevare ed evitare contenuti dannosi. Questo sistema funziona sia su prompt che su completamento.

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Medio
Violenza	Prompt e completamenti	Medio
Sessuale	Prompt e completamenti	Medio
Autolesionismo	Prompt e completamenti	Medio
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D
Materiale protetto - testo	Completamenti	N/D
Materiale protetto - codice	Completamenti	N/D

Modelli di visione: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o e GPT-4 Turbo

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Medio
Violenza	Prompt e completamenti	Medio
Sessuale	Prompt e completamenti	Medio
Autolesionismo	Prompt e completamenti	Medio
Identificazione di singoli utenti e inferenza di attributi sensibili	Prompt	N/D
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D

DALL-E 3 e DALL-E 2

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Basso
Violenza	Prompt e completamenti	Basso
Sessuale	Prompt e completamenti	Basso
Autolesionismo	Prompt e completamenti	Basso
Credenziali del contenuto	Completamenti	N/D
Generazione ingannevole di candidati politici	Prompt	N/D
Rappresentazioni di figure pubbliche	Prompt	N/D
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D
Materiale protetto - personaggi di arte e studio	Prompt	N/D
Contenuto volgare	Prompt	N/D

Oltre alle configurazioni di sicurezza precedenti, Azure OpenAI DALL-E include anche trasformazione di prompt per impostazione predefinita. Questa trasformazione si verifica su tutti i prompt per migliorare la sicurezza della richiesta originale, in particolare nelle categorie di rischio di diversità, generazione ingannevole di candidati politici, rappresentazioni di figure pubbliche, materiale protetto e altri.

Condividi tramite

Criteri di sicurezza dei contenuti predefiniti

Modelli di testo: GPT-4, GPT-3.5

Modelli di visione: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o e GPT-4 Turbo

DALL-E 3 e DALL-E 2

Commenti e suggerimenti

Risorse aggiuntive