題 如何將圖像製作成格式豐富的文檔?


所以我手裡拿著一本雜誌(有幾頁),我希望得到一個結果文件,它可以保持整個圖表和圖像完好無損,但仍允許我搜索/查找並選擇文本。

這個PDF 是我希望得到的結果的一個小例子。即使標題是可選的!它似乎是為PDF而不是掃描創建的,但你明白了。

結果文件不需要是PDF,但我懷疑有更好的格式。該文檔需要是一個文件(用於離線閱讀)和盡可能跨平台兼容。

在那兒 任何(簡單) 解決這個問題?如果沒有,我怎麼能至少手動完成OCR的工作?


2
2018-06-28 18:02


起源




答案:


編輯:@Cawas報導 PDF-Exchange查看器 成功完成任務,對PDF執行OCR並使其可搜索。

對於您列出的需求,PDF可能是最簡單,最跨平台的。另一個更為模糊的替代方案是DJVU格式,但與PDF不同的是,對它們的支持明顯較少,特別是在OCR方面。

有一個 免費光學字符識別的數量 可用且易於使用的軟件。但是,如果您正在尋找一個非常簡單的解決方案,那麼您上傳到Google雲端硬盤的任何PDF文檔都會 自動對其執行OCR。對此有一些限制,但它應適用於簡短文檔。


2
2018-06-28 19:54



我過去和今天都嘗試過谷歌硬盤。它無法處理2頁3 MB的PDF,非常簡單。此外,在我之前的所有試驗中,它將讀取INTO文本中的文本而不是PDF中的文本作為我的例子。 - cregox
道歉,PDF-XChange Viewer支持我認為您正在尋找的東西,在PDF上執行OCR並使其可搜索。 - peanut_butter
聽起來很神奇!我會在接下來的幾天裡嘗試一下。 - cregox
你真的應該編輯你的答案...... PDF-XChange Viewer為我做了。當OCR出錯時,我找不到解決方法,但它完美無缺! - cregox
很高興聽到!將其添加到頂部。 - peanut_butter