[Share Experiences] 演示一个搜狗拼音细胞词库生成、制作、修改的小工具
Tofloor
poster avatar
MeGusta
deepin
2024-11-06 15:05
Author

因为之前研究了一下搜狗拼音细胞词库的数据结构,然后借助ChatGPT,现学了一下cpp和qt5,就写了这么一个程序。

之前只学了一点点python,作为初学cpp的菜鸟,程序还一些问题要优化一下,等改好了,再发出来。

别问我“为什么不用xxx、用xxx不香吗?”类似的问题,不想回答。

现在展示一下效果,演示环境为UOS v20 1071 AMD64。

a.关联打开搜狗拼音.scel或者QQ拼音.qcel,并显示词库信息

录屏_选择区域_20241106145355.gif

b.从中文词条制作文本词库、制作细胞词库、修改词库属性信息

录屏_选择区域_20241106150205.gif

Reply Favorite View the author
All Replies
晚秋(lateautumn)
Moderator
2024-11-06 16:47
#1

搜狗输入法有点卡,不知道有没有同感的,所以又切回内置的五笔拼音了。applaud

Reply View the author
MeGusta
deepin
2024-11-06 17:08
#2

还好吧,因为主要在办公室用uos,感觉跟原来的fcitx版区别不大。也许是deepin的问题?

Reply View the author
Oli
deepin
2024-11-07 01:10
#3

like like like

Reply View the author
小鱼贝壳
deepin
2024-11-08 01:02
#4

applaud

Reply View the author
小小怪冲啊!
deepin
2024-11-08 03:31
#5

like like

Reply View the author
139******55
deepin
2025-05-15 17:01
#6

从演示来看,是一个很实用的工具,希望能够分享,先感谢。

Reply View the author
雷子哥deepin
deepin
2025-07-15 19:23
#7

需要需要,能不能分享?

Reply View the author
MeGusta
deepin
2025-07-15 21:44
#8
雷子哥deepin

需要需要,能不能分享?

不好意思,最近比较忙,等得空了,整理一下,再发布出来。

Reply View the author
雷子哥deepin
deepin
2025-07-16 11:57
#9

期待楼主分享,这能解决很大问题。

我的思路是,准备好一堆某方向专业资料,全部喂给结巴分词,结果借助excel去重,借助楼主作品,直接制作自己的词库。

搜狗官方网站也有在线词库制作https://pinyin.sogou.com/dict/create_dict.php,一次也没有成功过,网站也没客服,微信联系公众号也爱搭不理……

我在网上找到一个东西https://gitee.com/studyzy/imewlconverter,大神studyzy制作的imewlconverter,又叫“深蓝词库转换”,但是对于 .scel,只支持scel->txt,对于txt->scel没有办法。

也许是我没找到用法,大家可以研究下。

Reply View the author
MeGusta
deepin
2025-07-16 13:12
#10
雷子哥deepin

期待楼主分享,这能解决很大问题。

我的思路是,准备好一堆某方向专业资料,全部喂给结巴分词,结果借助excel去重,借助楼主作品,直接制作自己的词库。

搜狗官方网站也有在线词库制作https://pinyin.sogou.com/dict/create_dict.php,一次也没有成功过,网站也没客服,微信联系公众号也爱搭不理……

我在网上找到一个东西https://gitee.com/studyzy/imewlconverter,大神studyzy制作的imewlconverter,又叫“深蓝词库转换”,但是对于 .scel,只支持scel->txt,对于txt->scel没有办法。

也许是我没找到用法,大家可以研究下。

搜狗输入法3.6版提供了一个独立的命令行工具scdmaker.exe,可以从txt转换为scel,在新版里面就合并到sgtools里面去了,很不好调用。

我的这个工具的原理就是用qt-gui程序调用deepin-wine,把参数传递给scdmaker,来执行txt转scel的功能。

然后通过逆向分析scel/qcel词库的格式,对某些字节码进行修改,就可以对词库的属性信息进行一些自定义。

我之前整理词库的方法也是用wps表格之类的工具,对词条进行加工整理,再转换为scel。

Reply View the author
MeGusta
deepin
2025-07-17 14:21
#11
雷子哥deepin

期待楼主分享,这能解决很大问题。

我的思路是,准备好一堆某方向专业资料,全部喂给结巴分词,结果借助excel去重,借助楼主作品,直接制作自己的词库。

搜狗官方网站也有在线词库制作https://pinyin.sogou.com/dict/create_dict.php,一次也没有成功过,网站也没客服,微信联系公众号也爱搭不理……

我在网上找到一个东西https://gitee.com/studyzy/imewlconverter,大神studyzy制作的imewlconverter,又叫“深蓝词库转换”,但是对于 .scel,只支持scel->txt,对于txt->scel没有办法。

也许是我没找到用法,大家可以研究下。

Reply View the author