Competenza cognitiva di rilevamento lingua

La competenza Rilevamento lingua rileva la lingua del testo di input e segnala un singolo codice linguistico per ogni documento inviato nella richiesta. Il codice lingua è associato a un punteggio che indica il livello di attendibilità dell'analisi. Questa competenza usa i modelli di Machine Learning forniti nel linguaggio di intelligenza artificiale di Azure.

Questa funzionalità è particolarmente utile quando è necessario specificare la lingua del testo come input per altre competenze (ad esempio, la competenza Analisi del sentiment o la competenza Divisione del testo).

Vedere le lingue supportate per il rilevamento della lingua. Se il contenuto è espresso in una lingua non supportata, la risposta è (Unknown).

Nota

Questa competenza è associata ai servizi di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione delle competenze predefinite viene addebitata secondo gli attuali prezzi con pagamento in base al consumo dei Servizi di Azure AI.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Limiti dei dati

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli alla competenza di rilevamento della lingua, è possibile usare la competenza Suddivisione testo.

Parametri della competenza

I parametri fanno distinzione tra maiuscole e minuscole.

Input Descrizione
defaultCountryHint (Facoltativo) È possibile specificare un codice paese ISO 3166-1 alfa-2 di due lettere da usare come suggerimento per il modello di rilevamento della lingua se non può disambiguare la lingua. In particolare, il defaultCountryHint parametro viene usato con i documenti che non specificano l'input countryHint in modo esplicito.
modelVersion (Facoltativo) Specifica la versione del modello da usare quando si chiama il rilevamento della lingua. Per impostazione predefinita, la versione più recente disponibile quando non è specificata. È consigliabile non specificare questo valore a meno che non sia necessario.

Input competenze

I parametri fanno distinzione tra maiuscole e minuscole.

Input Descrizione
text Testo da analizzare.
countryHint Codice paese ISO 3166-1 alfa-2 da usare come suggerimento per il modello di rilevamento della lingua se non può disambiguare la lingua.

Output competenze

Nome output Descrizione
languageCode Il codice di lingua ISO 6391 per la lingua identificata. Ad esempio, "en".
languageName Il nome della lingua. Ad esempio, "Inglese".
score Immettere un valore compreso tra 0 e 1. La probabilità che lingua sia identificata correttamente. Il punteggio può essere inferiore a 1 se la frase ha lingue miste.

Definizione di esempio

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Input di esempio

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Output di esempio

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Vedi anche