Home
Categories
WIKI
Topic
User
LANGUAGE:
中文
English
文本 Pdf 转 Word 文档的软件推荐:abiword
Apps Section
1496
views ·
4
replies ·
To
floor
Go
st******ra@outlook.com
deepin
2019-06-27 10:19
Author
本帖最后由 new2dp 于 2019-6-27 11:11 编辑
一、前言:
试了一下坛友 @mydream 帖子「
https://bbs.deepin.org/post/179896
」中的 pdf转word 工具,发现安装、配置过程略为有些繁琐、描述有些陈旧:
(1)它给的创建python虚拟环境的命令老了,现在不推荐用 pyvenv xxxxxx 而是 python -m venv xxxxxx 了。(刚刚试的时候,我是用的 python3 的相关命令。)
(2)根据它的指南,使用 pip3 install -r requirements.txt 安装相关库的时候,pdfminer3k和另外一个没有安装成功。不过尽管如此,最后转换 pdf 文档为 doc 的时候倒也并没有报错。
(3)效果的话,纯的文本的pdf文档的转换效果还不错;而有其他对象,比如图片、表格等的pdf文档则效果欠佳,表格中的文本可以几乎完美识别,而图片、表格框架则无法识别而留空。所以,对于pdf中原为表格加文本的情况,转换之后只剩下文本,文本的对齐等格式就需要在word软件中自行调整了。
二、推荐 abiword:
有鉴于此,如果只是用来转换文本内容的pdf文档为word文档的话,我倒是建议使用 apt 仓库中现成的 abiword 。对比了一下,和上面这个工具的效果都差不多,而且有GUI哦!
当然了,能够在终端中使用命令是必须滴!
# 安装
sudo apt install abiword
# 转换格式
abiword --to=doc xxxx.pdf
# 查看手册
man abiword
Copy the Code
三、参考:
另外,据说 LibreOffice 自带了转换 pdf 为 word 文档的功能,有兴趣的话建议自行尝试。
Reply
Like 0
Favorite
View the author
All Replies
ms100
deepin
2019-06-27 16:17
#1
谢谢分享,收藏了
Reply
Like 0
View the author
sgb76
deepin
2019-06-27 19:00
#2
这方面需求倒不是很多,不过还是谢谢啦
Reply
Like 0
View the author
windfast
deepin
2019-06-27 21:41
#3
smallpdf.com了解一下,格式转换最好的工具
Reply
Like 0
View the author
st******ra@outlook.com
deepin
2019-06-27 21:56
#4
https://bbs.deepin.org/post/179910
smallpdf.com了解一下,格式转换最好的工具
嗯,这也是很好用的一个在线转换工具。谢谢补充!
Reply
Like 0
View the author
Please
sign
in first
Featured Collection
Change
[Tutorial] deepin25 WSL Offline Installation Guide
UOS AI 2.8 Released! Three New Intelligent Agents & Major Evolution
Solid Q&A | deepin 25 Common Questions – The Immutable System Edition
New Thread
Popular Events
More
一、前言:
试了一下坛友 @mydream 帖子「https://bbs.deepin.org/post/179896」中的 pdf转word 工具,发现安装、配置过程略为有些繁琐、描述有些陈旧:
(1)它给的创建python虚拟环境的命令老了,现在不推荐用 pyvenv xxxxxx 而是 python -m venv xxxxxx 了。(刚刚试的时候,我是用的 python3 的相关命令。)
(2)根据它的指南,使用 pip3 install -r requirements.txt 安装相关库的时候,pdfminer3k和另外一个没有安装成功。不过尽管如此,最后转换 pdf 文档为 doc 的时候倒也并没有报错。
(3)效果的话,纯的文本的pdf文档的转换效果还不错;而有其他对象,比如图片、表格等的pdf文档则效果欠佳,表格中的文本可以几乎完美识别,而图片、表格框架则无法识别而留空。所以,对于pdf中原为表格加文本的情况,转换之后只剩下文本,文本的对齐等格式就需要在word软件中自行调整了。
二、推荐 abiword:
有鉴于此,如果只是用来转换文本内容的pdf文档为word文档的话,我倒是建议使用 apt 仓库中现成的 abiword 。对比了一下,和上面这个工具的效果都差不多,而且有GUI哦!
当然了,能够在终端中使用命令是必须滴!
三、参考:
另外,据说 LibreOffice 自带了转换 pdf 为 word 文档的功能,有兴趣的话建议自行尝试。