Che cos'è la traduzione di documenti?

Traduzione di documenti è una funzionalità di traduzione automatica basata sul cloud del servizio Traduttore per Azure AI. È possibile tradurre più documenti complessi in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura originale e il formato dei dati. L'API Traduzione di documenti supporta due processi di traduzione:

  • La traduzione in batch asincrona supporta l'elaborazione di più documenti e file di grandi dimensioni. Il processo di traduzione batch richiede un account di Archiviazione BLOB di Azure con contenitori di archiviazione per i documenti di origine e tradotti.

  • La modalità sincrona per file singolo supporta l'elaborazione di traduzioni di file singoli. Il processo di traduzione dei file non richiede un account di Archiviazione BLOB di Azure. La risposta finale contiene il documento tradotto e viene restituita direttamente al client chiamante.

Traduzione batch asincrona

Usare l'elaborazione asincrona dei documenti per convertire più documenti e file di grandi dimensioni.

Funzionalità principali batch

Funzionalità Descrizione
Tradurre file di grandi dimensioni Tradurre documenti interi in modo asincrono.
Tradurre numerosi file Tradurre più file in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura del documento e il formato dei dati.
Mantieni la presentazione dei file di origine Tradurre i file mantenendo il layout e il formato originali.
Applica traduzione personalizzata Tradurre i documenti usando modelli di traduzione generici e personalizzati.
Applicare glossari personalizzati Tradurre i documenti usando glossari personalizzati.
Rileva automaticamente lingua documento Consentire al servizio Traduzione di documenti di determinare la lingua del documento.
Tradurre documenti con contenuto in più lingue Usare la funzionalità di correzione automatica per tradurre documenti con contenuto in più lingue nella lingua di destinazione.

Opzioni di sviluppo batch

È possibile aggiungere traduzione di documenti alle applicazioni usando l'API REST o un SDK della libreria client:

  • L'API REST. È un'interfaccia indipendente dal linguaggio che consente di creare richieste HTTP e intestazioni di autorizzazione per tradurre i documenti.

  • Gli SDK della libreria client sono classi, oggetti, metodi e codice specifici del linguaggio che è possibile usare rapidamente aggiungendo un riferimento nel progetto. Attualmente la traduzione di documenti include il supporto del linguaggio di programmazione per C#/.NET e Python.

Formati di documento supportati batch

Il metodo Get per ottenere i formati di documento supportati restituisce un elenco di formati di documento supportati dal servizio di traduzione di documenti. L'elenco include l'estensione di file comune e il tipo di contenuto, se si usa l'API di caricamento.

Tipo di file Estensione di file Descrizione
Adobe PDF pdf Formato di file di documento portatile. Traduzione di documenti usa la tecnologia di riconoscimento ottico dei caratteri (OCR) per estrarre e tradurre il testo nel documento PDF scansionato mantenendo il layout originale.
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
HTML html, htm Hyper Text Markup Language.
Localization Interchange File Format xlf Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Linguaggio di markup leggero per la creazione di testo formattato.
M​HTML mthml, mht Formato di archivio di pagine Web usato per combinare il codice HTML e le relative risorse complementari.
Microsoft Excel xls, xlsx Un file di foglio di calcolo per l'analisi e la documentazione dei dati.
Microsoft Outlook msg Messaggio di posta elettronica creato o salvato in Microsoft Outlook.
Microsoft PowerPoint ppt, pptx File di presentazione utilizzato per visualizzare il contenuto in un formato di presentazione.
Microsoft Word doc, docx File di documento di testo.
Testo OpenDocument odt File di documento di testo open source.
Presentazione OpenDocument odp File di presentazione open source.
Foglio di calcolo OpenDocument ods Un file di foglio di calcolo open source.
Formato RTF rtf Documento di testo contenente formattazione.
Valori delimitati da tabulazioni/TAB tsv/tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.
Testo txt Documento di testo non formattato.

Tipi di file legacy batch

I tipi di file di origine vengono mantenuti durante la traduzione del documento con le eccezioni seguenti:

Estensione del file di origine Estensione file tradotto
.doc, .odt, .rtf, DOCX
.xls, .ods XLSX
.ppt, .odp PPTX

Formati di glossario supportati batch

La traduzione di documenti supporta i tipi di file di glossario seguenti:

Tipo di file Estensione di file Descrizione
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
Localization Interchange File Format xlf , xliff Formato di documento parallelo, esportazione dei sistemi di memoria di traduzione. Le lingue usate sono definite all'interno del file.
Valori delimitati da tabulazioni/TAB tsv, tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.

Transazione sincrona

Usare l'elaborazione sincrona della traduzione per inviare un documento come parte del corpo della richiesta HTTP e ricevere il documento tradotto nella risposta HTTP.

Funzioni chiave della traduzione sincrona

Funzionalità Descrizione
Tradurre file a pagina singola La richiesta sincrona accetta solo un singolo documento come input.
Mantieni la presentazione dei file di origine Tradurre i file mantenendo il layout e il formato originali.
Applica traduzione personalizzata Tradurre i documenti usando modelli di traduzione generici e personalizzati.
Applicare glossari personalizzati Tradurre i documenti usando glossari personalizzati.
Traduzione di lingua singola Tradurre in e da una lingua supportata.
Rileva automaticamente lingua documento Consentire al servizio traduzione di documenti di determinare la lingua del documento.
Applicare glossari personalizzati Tradurre un documento usando un glossario personalizzato.

Formati di documento supportati sincroni

Tipo di file Estensione di file Tipo di contenuto Descrizione
Testo normale .txt text/plain Documento di testo non formattato.
Valori delimitati da tabulazioni .txv
.tab
text/tab-separated-values Formato di file di testo che usa le schede per separare valori e righe nuove per separare i record.
Valori delimitati da virgole .csv text/csv Formato di file di testo che usa virgole come delimitatori tra i valori.
HyperText Markup Language .html
.htm
text/html HTML è un linguaggio di markup standard usato per strutturare pagine Web e contenuto.
M​HTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Formato di file di archivio di pagine Web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Formato di file basato su XML utilizzato per le presentazioni PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Formato di file basato su XML utilizzato per i fogli di calcolo di Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Formato di file basato su XML utilizzato per i documenti di Word.
Microsoft Outlook .msg application/vnd.ms-outlook Formato di file utilizzato per gli oggetti messaggio di posta di Outlook archiviati.
Xml Localization Interchange .xlf
.xliff
application/xliff+xml Formato di file basato su XML standardizzato ampiamente usato nell'elaborazione del software di traduzione e localizzazione.

Formati di glossario supportati sincroni

La traduzione di documenti supporta i tipi di file di glossario seguenti:

Tipo di file Estensione di file Descrizione
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
XmlLocalizationInterchange xlf , xliff Formato basato su XML, progettato per standardizzare la modalità di passaggio dei dati durante il processo di localizzazione.
TabSeparatedValues tsv, tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.

Limiti alle richieste di traduzione di documenti

Per informazioni dettagliate sui limiti delle richieste del servizio Traduttore per Azure AI, vedere Limiti delle richieste di traduzione di documenti.

Residenza dei dati di traduzione di documenti

La residenza dei dati di traduzione di documenti dipende dall'area di Azure in cui è stata creata la risorsa Traduttore:

✔️ Funzionalità: Traduzione di documenti
✔️ Endpoint di servizio: Personalizzato: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Area creata dalla risorsa Data center di elaborazione della richiesta
Global Data center più vicino disponibile.
Americhe Stati Uniti orientali 2 • Stati Uniti occidentali 2
Asia/Pacifico Giappone orientale • Asia sud-orientale
Europa (ad eccezione della Svizzera) Francia centrale • Europa occidentale
Svizzera Svizzera settentrionale • Svizzera occidentale

Passaggi successivi

Nella guida introduttiva si apprenderà come iniziare rapidamente a usare la traduzione di documenti. Per iniziare, è necessario un account Azure attivo. Se non si ha un account, è possibile crearne uno gratuito.