發票處理預建 AI 模型

發票處理預建 AI 模型擷取主要發票資料,以協助您自動處理發票。 發票處理模型已最佳化,以辨識一般發票元素,例如發票識別碼、發票日期、應付金額和其他。

發票模型可讓您建立 自訂發票模型 ,以擴充預設行為。

在 Power Apps 中使用

若要深入了解如何在 Power Apps 中使用發票處理預建模型,請移至使用 Power Apps 中的發票處理預建模型

在 Power Automate 中使用

若要深入了解如何在 Power Automate 中使用發票處理預建模型,請移至使用 Power Automate 中的發票處理預建模型

支援的語言和檔案

支援以下語言:阿爾巴尼亞文 (阿爾巴尼亞)、捷克文 (捷克共和國)、中文 (簡體)、中文 (繁體) 香港特別行政區、中文 (繁體) 台灣、丹麥文 (丹麥)、克羅埃西亞文 (波士尼亞與赫塞哥維納)、克羅埃西亞文 (克羅埃西亞)、克羅埃西亞文 (塞爾維亞)、荷蘭文 (荷蘭)、英文 (澳洲)、英文 (加拿大)、英文 (印度)、英文 (英國)、英文 (美國)、愛沙尼亞文 (愛沙尼亞)、芬蘭 (芬蘭)、法文 (法國)、德文 (德國)、匈牙利文 (匈牙利)、冰島文 (冰島)、義大利文 (義大利)、日文 (日本)、韓文 (韓國)、立陶宛文 (立陶宛)、拉脫維亞文 (拉脫維亞)、馬來文 (馬來西亞)、挪威文 (挪威)、波蘭文 (波蘭)、葡萄牙文 (葡萄牙)、羅馬尼亞文 (羅馬尼亞)、斯洛伐克文 (斯洛伐克)、斯洛維尼亞文 (斯洛維尼亞)、塞爾維亞文 (塞爾維亞)、西班牙文 (西班牙)、瑞典文 (瑞典)。

若要取得最佳的結果,請為每張發票提供一張清晰的照片或掃描檔案。

  • 影像格式必須為 JPEG、PNG 或 PDF。
  • 檔案大小不得超過 20 MB。
  • 映像維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
  • PDF 維度必須最小為 17 x 17 英寸,相當於 Legal 或 A3 紙張的大小或更小。
  • 對於 PDF 文件,僅處理前 2,000 頁。

模型輸出

如果偵測到發票,發票處理模型會輸出下列資訊:

屬性 定義
應付金額 (文字) 發票中載明的應付金額。
應付金額 (數字) 標準化數字格式中的應付金額。 範例:1234.98。
應付金額的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
帳單地址 帳單地址。
帳單地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
帳單地址收件者 帳單地址收件者。
帳單地址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
客戶地址 客戶地址。
客戶地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
客戶地址收件者 客戶地址收件者。
客戶地址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
客戶識別碼 客戶識別碼。
客戶識別碼的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
客戶名稱 客戶姓名。
客戶名稱的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
客戶稅務識別碼 與客戶相關聯的納稅人編號。
客戶稅務識別碼的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
到期日 (文字) 發票中載明的到期日。
到期日 (日期) 標準化日期格式的到期日。 範例:2019-05-31。
到期日的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
發票日期 (文字) 發票中載明的發票日期。
發票日期 (日期) 標準化日期格式的發票日期。 範例:2019-05-31。
發票日期的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
發票識別碼 發票識別碼。
發票識別碼的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
發票總額 (文字) 發票中載明的發票總額。
發票總額 (數字) 標準化日期格式的發票總額。 範例:2019-05-31。
發票總額的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
明細項目 從發票擷取的明細項目。 每個資料行都有可用的信賴分數。
  • 明細項目金額:明細項目的金額。 以文字與數字格式傳回。
  • 明細項目描述:明細項目的描述。 以文字格式傳回。
  • 明細項目數量:明細項目的數量。 以文字與數字格式傳回。
  • 明細項目單價:明細項目的單價。 以文字與數字格式傳回。
  • 明細項目產品代碼:明細項目的產品代碼。 以文字格式傳回。
  • 明細項目單位:明細項目的單位 (例如,公斤和磅)。 以文字格式傳回。
  • 明細項目日期:明細項目的日期。 以文字與日期格式傳回。
  • 明細項目稅金:明細項目的稅金。 以文字與數字格式傳回。
  • 明細項目所有資料行:會將明細項目中的所有資料行當作文字行傳回。
付款條件 發票的付款條件。
付款條件的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
採購單 採購單。
採購單的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
前期未付餘額 (文字) 發票中載明的前期未付餘額。
前期未付餘額 (數字) 以標準化數字格式表示前期未付餘額。 範例:1234.98。
前期未付餘額的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
匯款地址 匯款地址。
匯款地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
匯款地址收件者 匯款地址收件者。
匯款地址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
服務地址 服務地址。
服務地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
服務地址收件者 服務地址收件者。
服務地址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
服務開始日期 (文字) 發票中載明的服務開始日期。
服務開始日期 (日期) 以標準化數字格式表示服務開始日期。 範例:2019-05-31。
服務開始日期的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
服務結束日期 (文字) 發票中載明的服務結束日期。
服務結束日期 (日期) 以標準化數字格式表示服務結束日期。 範例:2019-05-31。
服務結束日期的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
寄送地址 運送地址。
寄送地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
寄送地址收件者 寄送地址收件者。
寄送地址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
小計 (文字) 發票中載明的小計。
小計 (數字) 標準化數字格式中的小計。 範例:1234.98。
小計的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
稅金總計 (文字) 發票中載明的稅金總計。
稅金總計 (數字) 標準化數字格式中的稅金總計。 範例:1234.98。
稅金總計的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
廠商地址 廠商地址。
廠商地址的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
廠商地址收件者 廠商地址收件者。
廠商位址收件者的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
廠商名稱 廠商名稱。
廠商名稱的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
廠商稅務識別碼 與廠商相關聯的納稅人編號。
廠商稅務識別碼的信賴度 模型對其預測的信賴度為何。 分數介於 0 (信賴度低) 和 1 (信賴度高) 之間。
偵測到的文字 在發票上執行 OCR 的已辨識文字行。 做為文字清單的一部分傳回。
偵測到的索引鍵 索引鍵/值組是所有的已識別標籤或索引鍵,以及其相關聯的回應或值。 您可以使用這些值來擷取不屬於欄位預先定義清單的其他值。
偵測到的值 索引鍵/值組是所有的已識別標籤或索引鍵,以及其相關聯的回應或值。 您可以使用這些值來擷取不屬於欄位預先定義清單的其他值。

索引鍵/值組

索引鍵/值組是所有的已識別標籤或索引鍵,以及其相關聯的回應或值。 您可以使用這些值來擷取不屬於欄位預先定義清單的其他值。

若要具體呈現發票處理模型所偵測到的所有索引鍵/值組,您可以在流程中新增建立 HTML 資料表動作 (如螢幕擷取畫面所示),並執行流程。

發票中所有索引鍵/值組的螢幕擷取畫面。

發票中所有索引鍵/值組 - 結果的螢幕擷取畫面。

若要擷取已知其值的特定索引鍵,您可以使用篩選陣列動作,如以下螢幕擷取畫面所示。 在螢幕擷取畫面的範例中,我們想要擷取主要電話的值:

如何擷取指定索引鍵的值的螢幕擷取畫面。

限制

下列限制適用於每個環境跨文件處理模型 (包括預建模型) 進行的呼叫:收據處理和發票處理。

目的 限制 更新期間
呼叫 (每個環境) 360 60 秒鐘

建立自訂發票處理解決方案

發票處理預建 AI 模型的設計目的是要擷取在發票中找到的一般欄位。 由於每個業務都是唯一的,因此您可能想要擷取此預建模型中未包含的其他欄位。 對於您使用的特定類型發票,也可能無法順利擷取某些標準欄位。 有兩種方式可以解決這種情況:

  • 使用自訂發票處理模型:除了預設欄位之外,還新增要提取的新欄位或未正確提取的文件範例,從而增強預先建立發票處理模型的行為。 若要深入了解如何擴充預先建立的發票處理模型,請移至選取文件類型

  • 查看原始 OCR 結果:每次發票處理預建 AI 模型處理您提供的檔案時,也會執行 OCR 作業來擷取寫入檔案中的所有字詞。 您可以在模型所提供的偵測文字輸出上存取原始 OCR 結果。 對偵測到的文字所傳回的內容進行簡單搜尋,可能就足以取得您所需的資料。

  • 使用文件處理:使用 AI Builder,您也可以建立自己的自訂 AI 模型,以擷取您使用之文件所需的特定欄位與資料表。 只要建立文件處理模型並加以定型,就可以從與發票擷取模型不相容的發票中擷取所有資訊。

定型自訂文件處理模型之後,您可以將它其與 Power Automate 流程中的發票處理預建模型相結合。

以下列出一些範例:

使用自訂文件處理模型來擷取未由發票處理預建模型傳回的其他欄位

我們在此範例中定型了一個自訂文件處理模型來擷取忠誠計畫編號,該編號僅出現在來自 Adatum 和 Contoso 提供者的發票中。

只要有新發票新增至 SharePoint 資料夾,就會觸發此流程。 然後,它會呼叫發票處理預建 AI 模型,以擷取其資料。 接下來,我們將檢查已處理之發票的供應商是否來自 Adatum 或 Contoso。 如果是這種情況,我們會呼叫一個經過定型的自訂文件處理模型,來獲取該忠誠度編號。 最後,我們將從發票中擷取的資料儲存在 Excel 檔案中。

發票和文件處理流程的螢幕擷取畫面。

如果發票處理預建模型傳回的欄位的信賴度分數較低,請使用自訂文件處理模型

我們在此範例中定型了一個自訂文件處理模型來擷取發票的總金額,在使用發票處理預建模型時,信賴分數通常會比較低。

只要有新發票新增至 SharePoint 資料夾,就會觸發此流程。 然後,它會呼叫發票處理預建 AI 模型,以擷取其資料。 接下來,我們要檢查發票總計值屬性的信賴分數是否小於 0.65。 如果是這種情況,我們就會呼叫自訂文件處理模型,我們已經用發票定型過該模型,在該模型中,我們通常會在整個欄位中獲得較低的信賴度分數。 最後,我們將從發票中擷取的資料儲存在 Excel 檔案中。

分數低的發票和文件處理流程螢幕擷取畫面。

使用發票處理預建模型來處理自訂文件處理模型尚未經過定型可以處理的發票

發票處理預建模型的一種使用方式是將其當作遞補模型,以處理您尚未在自訂文件處理模型中定型的發票。 例如,假設您組建了一個文件處理模型並加以定型,以從您的前 20 個發票提供者中擷取資料。 然後,您可以使用發票處理預建模型來處理所有新發票或較少量的發票。 以下是如何進行此作業的範例:

只要有新發票新增至 SharePoint 資料夾,就會觸發此流程。 然後它呼叫自訂文件處理模型來擷取其資料。 接下來,我們要檢查已偵測集合的信賴度分數是否小於 0.65。 如果是這種情況,則可能表示提供的發票與自訂模型不太相符。 然後我們會呼叫預建發票處理模型。 最後,我們將從發票中擷取的資料儲存在 Excel 檔案中。

新發票的發票和文件處理流程螢幕擷取畫面。