題 如何將.PDF和.doc / .docx文件轉換為.HTML文件?


有沒有人知道任何可以將PDF和/或DOC / DOCX(也可能是其他文檔格式:rtf,txt等)轉換為HTML的軟件(最好是開源,Linux或PHP)?

我有“PDFtoHTML”軟件工作,但似乎也沒有轉換DOC / DOCX文件。


3
2017-10-26 19:16


起源




答案:


你應該給 unoconv 旋轉。它應該能夠將Open Office可以讀取的任何內容轉換為它可以編寫的任何內容。

這適用於doc / docx和許多其他文件。它似乎不適用於PDF,所以我猜你仍然堅持使用2個獨立的程序來完成這項工作。


1
2017-10-28 12:24



嗨jpjacobs,謝謝你的提示,我沒有聽說過unoconv,會給它一個機會,謝謝! -Tim


我成功地將可移植版本的libreoffice放在我主機的網絡服務器上,我用PHP調用它來執行命令行轉換為.docx等等。在飛行中。我在主持人的網絡服務器上沒有管理員權限。這是我做的博客文章:

http://geekswithblogs.net/robertphyatt/archive/2011/11/19/converting-.docx-to-pdf-or-.doc-to-pdf-or-.doc.aspx

好極了!使用PHP與LibreOffice(OpenOffice的後繼者)直接從.docx或.odt轉換為.pdf!


1
2017-11-20 01:50





你有沒有嘗試過 PHPDocX?它允許您使用docx文件執行更多操作。

有一個 generateXHTML方法


0
2018-05-08 06:33



它看起來像PHPDocX確實生成.docx文件,但我正在尋找將.docx文件轉換為HTML的軟件。我很困惑嗎? - tim peterson