http://38.207.133.74/droplet-voice-input_0.2.2_amd64.deb
市面上的语音输入法大多需要联网使用云端的语音API,不但使用门槛较高(要自己去申请api)语音,而且数据会上传到云端处理。
随着大模型技术的成熟,做一个完全离线的方案,保护用户隐私,同时也能在没有网络的环境下使用,已经可行了。虽然离线识别的准确率可能不如云端,但对于日常使用现在测试感觉应该够用了。
最终要的是,在linux下,居然就没有一个我认为能用的(包括使用云端api)的中文语音输入法,最近的这些项目大多都是语音转文字记录,而不是在任何位置都能语音输入的输入法!过节期间,搓了个自己能用的版本,拿出来给linux的程序员们分享一下,和claude code 、codex交流,可以动嘴不动手(少动手)了。
# 下载地址 wget http://38.207.133.74/droplet-voice-input_0.2.2_amd64.deb # 安装 sudo dpkg -i droplet-voice-input_0.2.2_amd64.deb
fcitx切换到语音输入法后(任务栏图标是个红色聊天框)
按一次右Ctrl键开始识别,再按一次停止。按了右Ctrl键后,光标所在位置会浮窗提示“开始录音”
在虚拟机中运行设置界面时,可能会出现黑屏。这是 egui 与虚拟机 GPU 加速的兼容性问题。
临时解决方案:
LIBGL_ALWAYS_SOFTWARE=1 vinput-settings
离线模型的准确率肯定不如云端大模型,特别是:
本软件为个人学习项目,仅供测试使用。使用过程中如遇到任何问题,作者不承担任何责任。建议在非重要场合测试,重要文档请及时保存。
再次感谢大家的支持和测试! 如果你觉得这个项目有意思,欢迎点赞、收藏、转发!
前排前排,大佬好厉害
这个框架才几百MB吗?
对,选了一个效果较好,体积比较小的模型。更好的模型要到1个G了,后面考虑成为可选装项目
Featured Collection
Popular Ranking
Popular Events
上次发布的0.1,下载地址被墙了,很多朋友没有下载成功,这次换个服务器,应该没问了。
http://38.207.133.74/droplet-voice-input_0.2.2_amd64.deb项目初衷
市面上的语音输入法大多需要联网使用云端的语音API,不但使用门槛较高(要自己去申请api)语音,而且数据会上传到云端处理。
随着大模型技术的成熟,做一个完全离线的方案,保护用户隐私,同时也能在没有网络的环境下使用,已经可行了。虽然离线识别的准确率可能不如云端,但对于日常使用现在测试感觉应该够用了。
最终要的是,在linux下,居然就没有一个我认为能用的(包括使用云端api)的中文语音输入法,最近的这些项目大多都是语音转文字记录,而不是在任何位置都能语音输入的输入法!过节期间,搓了个自己能用的版本,拿出来给linux的程序员们分享一下,和claude code 、codex交流,可以动嘴不动手(少动手)了。
主要特性
技术栈
系统要求
目前只测试了deepin 25,由于基本都是静态链接和编译,依赖很少,理论上都能运行。
系统要求
目前只测试了deepin 25,由于基本都是静态链接和编译,依赖很少,ubuntu等系统理论上都能运行。
安装方法
1. 下载安装包
2. 开始使用
fcitx切换到语音输入法后(任务栏图标是个红色聊天框)
按一次右Ctrl键开始识别,再按一次停止。按了右Ctrl键后,光标所在位置会浮窗提示“开始录音”
3. GUI 设置界面黑屏(虚拟机环境)
在虚拟机中运行设置界面时,可能会出现黑屏。这是 egui 与虚拟机 GPU 加速的兼容性问题。
临时解决方案:
4. 识别准确率
离线模型的准确率肯定不如云端大模型,特别是:
使用技巧
免责声明
本软件为个人学习项目,仅供测试使用。使用过程中如遇到任何问题,作者不承担任何责任。建议在非重要场合测试,重要文档请及时保存。
再次感谢大家的支持和测试!
如果你觉得这个项目有意思,欢迎点赞、收藏、转发!