文件轉換

此情境的結果是文件的可編輯版本。
在此情境中,系統會辨識文件影像並完整保留所有原始格式,再將資料儲存為可編輯的檔案格式。最終,您將獲得文件的可編輯版本,可輕鬆進行錯誤檢查與修改。
詳情請參閱 文件轉換。

在此處理情境中,紙本文件會被轉換為不可編輯的數位副本,並以可搜尋的格式保存所有文件資訊。經過此類處理後,文件的數位副本可透過全文搜尋在電子檔案庫中輕鬆找到,文件文字片段可供複製,文件亦可透過電子郵件傳送或列印輸出。
詳情請參閱 文件歸檔。
資料擷取

此情境用於從文件中擷取所有可能的資料,並以結構化方式儲存。
結果會是一個呈現文件結構的 JSON 檔案。它會儲存所有文件物件:印刷文字與手寫文字、表格、條碼、核取記號及影像,以及它們的位置和屬性。此格式最適合用於後續處理、將資料儲存到資料庫,或與其他應用程式整合。
如需詳細資訊,請參閱資料擷取。

此情境可擷取文件的本文文字,以及標誌、印章和本文以外任何元素上的文字。
文字的自然順序,也就是「人類閱讀時的方式」,會被保留下來。之後您可以將文件提供給您端的自然語言處理 (NLP) 引擎,例如用於快速摘要、搜尋敏感資訊,或進行情緒分析。
如需詳細資訊,請參閱文字擷取。

在欄位層級識別的情況下,系統會識別短文字片段,以擷取特定欄位中的資料。在此情境中,識別品質至關重要。
此情境也可作為更複雜情境的一部分,在這些情境中需要從文件中擷取有意義的資料 (例如,將紙本文件中的資料擷取到資訊系統和資料庫中,或在文件管理系統中自動對文件進行分類和建立索引) 。
在此情境中,系統會識別僅部分欄位中的數行文字,或小型影像上的全部文字。系統會為每個已識別的字元計算可信度評分。之後即可在檢查識別結果時使用這些可信度評分。此外,系統還可儲存文字中單字和字元的多個辨識變體,之後可在投票演算法中使用,以提高識別品質。
如需詳細資訊,請參閱欄位層級識別。

在此情境中,會使用 ABBYY FineReader Engine 讀取條碼。舉例來說,可能需要讀取條碼,以便自動分隔文件、供文件管理系統處理,或用於建立文件索引與分類。
此情境可作為其他情境的一部分。例如,使用高速生產型掃描器掃描的文件可透過條碼加以分隔,或準備長期保存的文件可根據其條碼值放入用於歸檔的文件管理系統中。
從文字中擷取條碼時,系統可偵測所有條碼,或僅偵測具有特定值的特定類型條碼。系統可取得條碼的值並計算其檢查碼。
已識別的條碼值可儲存為最便於後續處理的格式,例如 TXT。
如需詳細資訊,請參閱條碼辨識。

名片包含公司或個人的商務資訊。名片可包含姓名、公司名稱、電話號碼、傳真、電子郵件、網站地址及類似資訊。您可能需要從紙本名片中擷取這些資訊,並將其儲存為電子格式,例如手機的電子通訊錄、電子郵件客戶端,或任何其他資料儲存系統。例如,名片通常會以 vCard 格式透過電子郵件或網路傳送。
如需詳細資訊,請參閱名片辨識。

許多國家的官方旅行證件或身分證件都包含機器可讀區 (MRZ) ,可確保更準確地處理證件資料。
此情境用於在客戶註冊或驗證流程中,從身分證件上的機器可讀區擷取資料。系統會辨識文件影像上的 MRZ,並 從中擷取資料。擷取出的資料包含多個欄位,其中含有關於證件及其持有人的個人資訊 (證件類型與到期日、持有人的名與 姓等) 。您可以搜尋這些欄位、驗證資料,並將其儲存到外部檔案中,以供後續處理。
如需詳細資訊,請參閱 Machine-Readable Zone Capture。
其他

在此情境中,ABBYY FineReader Engine 會在「掃描電腦」上使用,用來掃描影像並將其儲存為檔案。
此情境可作為其他情境在文件處理前置階段的一部分,也就是用來取得文件的電子版本,以便進一步處理。使用範例包括為了歸檔而掃描文件、取得文件的可編輯版本,以及從文件中擷取有用的資料。
紙本文件經掃描後,影像會以電子格式儲存,從而產生高品質的印刷文件電子版本。
詳情請參閱掃描。

文件分類的任務,是將文件指派至使用者定義的其中一個類別。您可能需要處理由多種類型文件組成的文件流程,例如合約、發票、收據。您需要識別每份文件的類型。例如,您可能想要將文件分類到不同的資料夾中,或依據類型重新命名。 這些作業都可以透過預先訓練的系統自動完成。
此情境的重點在於,您已知將要處理哪些類型的文件。ABBYY FineReader Engine 可以根據文件的外觀或內容進行分類。
詳情請參閱文件分類。

處理紙本文件時,您可能需要找出並更正錯誤,或識別刻意做出的變更。
此情境用於比對特別重要的文件 (例如合約和銀行文件) 及其副本。比較結果會包含差異的相關資訊,包括內容類型 (僅文字) 、修改類型 (刪除、插入或修改) ,以及它們在原件與副本中的位置。您可以取得偵測到的差異清單,或任何變更的 區域,並將比較結果儲存到外部檔案,以便進一步處理或長期保存。
詳情請參閱文件比較。
