Panoramica del riconoscimento ottico dei caratteri in Microsoft Syntex

Nota

Fino a giugno 2025, è possibile provare gratuitamente il riconoscimento ottico dei caratteri e altri servizi Syntex selezionati se è stata configurata la fatturazione con pagamento in base al consumo . Per informazioni e limitazioni, vedere Provare Microsoft Syntex ed esplorare i relativi servizi.

Il servizio OCR (Optical Character Recognition) in Microsoft Syntex consente di estrarre testo stampato o scritto a mano da immagini e documenti. Esempi di immagini includono poster, disegni ed etichette di prodotto. Esempi di documenti includono articoli, report, moduli e fatture.

Il testo viene in genere estratto come parole, righe di testo e paragrafi o blocchi di testo, consentendo l'accesso alla versione digitale del testo analizzato. Le informazioni estratte vengono indicizzate nella ricerca e possono essere rese disponibili per le funzionalità di conformità, ad esempio la prevenzione della perdita dei dati.The extracted information is indexed in search and can be made available for compliance features like data loss prevention (DLP).

Ad esempio, si abilita il servizio OCR e quindi si aggiungono file di immagine alla raccolta documenti. Microsoft Syntex analizza automaticamente i file di immagine, estrae il testo pertinente e rende il testo dalle immagini disponibili per la ricerca e l'indicizzazione. Questa funzionalità consente di trovare rapidamente e accuratamente le parole chiave e le frasi che si sta cercando.

Requisiti e limitazioni

Tipi di file supportati

Endpoint Tipi di file supportati
SharePoint e OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf
Dispositivi Teams, Exchange e Windows .bmp, .png, .jpeg, .jpg, .tiff, and .pdf

Oltre al PDF basato su immagini, Syntex OCR supporterà pdf ibrido (testo e immagine PDF) a partire da novembre 2024. Dopo tale periodo, i PDF ibridi appena caricati verranno elaborati dal servizio OCR.

Nota

Quando si applica OCR a un file di immagine, il testo viene archiviato nella colonna Metadati di testo estratto . Quando si applica OCR a un file PDF o TIFF, il testo estratto viene indicizzato nella ricerca ma non disponibile nella colonna dei metadati.

Lingue supportate

Il servizio OCR supporta più di 150 lingue.

Posizioni e soluzioni supportate

Il servizio OCR supporta più soluzioni, come illustrato nella tabella seguente. Per informazioni dettagliate sulle soluzioni di conformità, vedere Posizioni e soluzioni supportate in Microsoft Purview.

Posizione Soluzione supportata
Exchange Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali.
Il testo è disponibile per le soluzioni di conformità.
Siti di SharePoint Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali.
Il testo è disponibile per le soluzioni di conformità.
Account di OneDrive Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali.
Il testo è disponibile per le soluzioni di conformità.
Messaggio di chat e canale di Teams Il testo è disponibile per le soluzioni di conformità.
Dispositivi Il testo è disponibile per le soluzioni di conformità.

Limitazioni relative ai file

  • Le immagini devono essere inferiori a 50 MB.

  • Le immagini devono essere di almeno 50 x 50 pixel e non superiori a 16.000 x 16.000 pixel.

  • Le immagini caricate dopo l'abilitazione di OCR sono le uniche immagini analizzate.

  • Le immagini incorporate nei documenti di Office non sono supportate.