[software development] 我一个小白因为没有剪映，尝试烧20亿token烧出一个视频剪辑软件

Technology Exchange 991 views · 24 replies ·

Claw龙虾bot

deepin

Backbone of ecological co-construction group

a day ago

Author

我一个小白因为没有剪映，尝试烧20亿token烧出一个视频剪辑软件

想用剪映，但是linux上没有原生的剪映可用

之前也尝试过Shotcut、Kdenlive、还有wine剪映，总感觉要么就是功能不是想要的，要么就是中文本地化很差、要么就是wine卡顿

还看到社区里面很多用户都想用剪映

但是我是一点代码都不懂的小白+Linux小白，一点都不懂
想到有着ai,于是vibe coding

刚开始用的是Wails+Golang+Vue的框架，后来发现Wails在Linux用的是Webkit2gtk,改到一半发现开了硬件加速渲染视频依然也是卡爆了，但是发现在浏览器端调试的时候没有这种现象，然后才恍然醒悟，是webkit2gtk的问题，因为chrome用的是chromium内核，wails用的是webkit内核。调半天还以为是代码的问题，结果跳了个大坑

（真的如非必要我以后再也不想碰gnome、gtk家的东西了）

最终的技术栈是：Electron + Vue 3 + Element Plus + Vite + Golang+Node.js，开发环境为Deepin25。Golang用子进程的方式跑在Electron主进程里，负责所有重型任务——视频解码、导出编码。前端只做UI交互和预览窗口的Canvas绘制以及着色器转场等等一些复杂且实时性较高的效果（使用webgl）。这个架构定下来之后，才算真正走上正轨。

尽量能本地化的功能都本地化，没办法，没钱租服务器给大家用。

邀请了GPT5.5+Opus+Deepseek v4 pro+Mimo 2.5+Gemini全被我拉来轮番当私教。Token烧得飞起。

最开始的token是白嫖来的——各种新注册送的免费额度、群里大佬分享的API key，能薅的都薅了。等到这些渠道枯竭，我开始自费买中转站的token。后来DeepSeek V4 Pro出了，价格直接打下来，性价比极高，我直接开启疯狂vibe coding模式，那时候是真的上瘾——半夜想到一个效果逻辑，爬起来就开聊，聊完直接贴代码跑。那段时间光DeepSeek一家就烧了超过10亿token。

后来Deepseek v4 pro出来真的让人喜大普奔，性价比之王，冲了钱，很多功能靠它堆出来的（感谢梁圣....）

缓存命中率那高得，命中缓存的token价格还便宜

不过也耐不住我这样子烧，也烧了不少钱

再后来Mimo出了创作者激励计划，送了我2亿token。我到手第一天就把它干完了。一天，2亿。不是浪费，是在做轨道帧缩略图的那几个晚上，反复问、反复验证、反复推翻重来。

接着就靠各种便宜中转站和邀请群友们注册送额度了

真的只是写代码而已：
（忽略左边的总成本，看Token数即可

Ligocut光剪

整体界面：

关于字幕、语音转文本：
像一些比较高频使用的语音转文本功能，由于别家厂商都是放在服务器上识别，但是由于我没有资金租服务器，再加上很多UOS用户都是内网用户，无法联网，所以我只能考虑本地方案。我软件默认内置了一个语音识别的小模型。

识别效果的话tiny小模型可以识别一点简单的发音和对话，会有错别字：

当然你也可以选择下载更大的模型：

点击下载和选择当前模型为你下载的模型即可，紧记要切换模型。

你觉得不满意你还可以自行配置ai多模态模型或者语音模型来识别

你还可以导出刚识别好的文本轨道为srt字幕文件

目前内置tiny模型只是在中英文上面识别好一点，其他语言暂时不建议，你们可以尝试使用small、base、large等等大一点的模型：

tiny模型的识别率对于歌曲来说还是不太准，可能是因为音调的问题：

更别说烫嘴rap了：
可以见到tiny一个字都是别不出来

由于时间和篇幅的关系我只能快速省略讲解一下以下的库了：
文本库：
默认内置几个常用的文本作为mvp

特效库：
默认内置一部分过渡效果

滤镜库：
默认内置几十个调色，后期考虑加入用户高频使用的调色作为内置。

转场库：
难度也是最大的，因为需要编写GLSL的着色器，目前很多转场只是一个占位，并未完善，等我后面有钱买token了再补充

AI辅助

因为想到ai可以辅助剪辑和操作，于是我暴露了74个接口让ai去调用

你可以用说话的方式：

而且你还可以把你创建的工作流“拼装”起来作为一个工作流组

还可以监控ai在做到哪一步：

接口的话后期可能还会增加，尽量把接口颗粒度再细分一些，方便ai调用。

另外还有的就是
AI版本的文字转语音，因为考虑到有人喜欢用ai转，准确率更高，所以留了一个方案给用户选择使用（需要用户自定配置对应的ai模型。

关于转场

转场有很多都是占位，目前很多都没有正确的效果的
转场需要涉及到GLSL着色器，需要编写着色器的代码，一百多个工作量巨大
后期考虑如何让用户写自己的转场或者着色器效果并分发导入

关键帧

可以在编辑面板打一点简单的关键帧

快捷键

目前想着可以让用户切换熟悉的快捷键，方便快速切换过来使用，但是没有完全核对过是否跟他们一致的快捷键

后期打算增加AE、剪映、达芬奇相关的快捷键作为可选项

导出

支持三种导出方式：

MediaRecorder方式：最快，但是质量最低，默认webm格式，其他格式需要勾选ffmpeg转换
图片序列帧的方式：慢，但是质量较好
直接ffmpeg导出：慢，但是质量较好。

其他：

还支持UOS1070（不过没仔细测试，大多数测试的场景都是在Deepin25和GXDE OS）

纯靠ai就可以做出来了吗？

“可以“，你只需要懂一点产品+架构+前端+golang后端+nodejs+linux基本命令+浏览器开发者工具，然后再去学习一点GLSL着色器、剪映的功能的使用，再参考一下FCPX、PR、AE的功能，再去搜索一下相关TTS、ASR的模型和资料，以及看一下B站给出来的方案是否合适，再跟各ai讨论一下，然后形成一个思路，你就可以得出一个MVP了。

Bugs

很多地方还有小bugs（例如蒙版）,待有钱买token再修😂

教程

视频教程有空再出

目前功能简单到一眼就看得出来功能

版本架构规划

初步构想，目前找不到机器来编译arm和loogarch

发行版	包类型	简要说明	x86_64	arm	loongarch64
UOS Deepin GXDE OS	完整版（学习版本）	包含所有功能，适合完整安装	com.ligocut_0.26.5 _amd64.deb	`找到机器再编译`	`找到机器再编译`
UOS Deepin GXDE OS	插件包	附加插件/扩展，需配合完整版使用	`有思路再说`	`有token再说`	`有token再说`

下载地址

我用夸克网盘分享了「文件夹持续更新」，点击链接即可保存。打开手机「夸克APP」，无需下载在线播放视频，畅享原画5倍速，支持电视投屏。
链接：https://pan.quark.cn/s/15db1851f83c

特别鸣谢

星火商店团队（Spark-Store）、GXDE OS团队以及公众号的一位粉丝给予的技术建议和token（费用）支持

喝杯咖啡

爱发电主页：https://www.ifdian.net/a/ligocut

希望各位小伙伴能顺便动动小手帮个忙扫一扫关注一下我的公众号：

如果你喜欢我的软件，
那就去我的公众号里的文章下方的*“喜欢作者”*请我喝杯咖啡~这样就可以有精神有更多的时间写更多的软件了

Reply Like 5 Favorite View the author

All Replies

1 / 2

Claw龙虾bot

deepin

Backbone of ecological co-construction group

a day ago

自古沙发楼主占

占楼耕鑫

Reply Like 0 View the author

罐子

Moderator

21 hours ago

能源码分享一下吗，我去龙芯上搞搞。

Reply Like 0 View the author

kookboy

deepin

20 hours ago

兄弟干得漂亮！

大伙也正在这么干，你并不孤单～

Reply Like 2 View the author

说书人

deepin

18 hours ago

楼主厉害了

Reply Like 0 View the author

　　　　　　㋂

deepin

14 hours ago

token不够，再多来点

Reply Like 0 View the author

Claw龙虾bot

deepin

Backbone of ecological co-construction group

14 hours ago

罐子：

能源码分享一下吗，我去龙芯上搞搞。

晚点私信我发网盘链接给你吧

Reply Like 0 View the author

zijinyise

deepin

14 hours ago

卧槽，膜拜巨佬

Reply Like 0 View the author

心若磐石不修仙

deepin

14 hours ago

Reply Like 0 View the author

剑风澜

deepin

14 hours ago

Claw龙虾bot：

晚点私信我发网盘链接给你吧

你头像呢？😏

Reply Like 0 View the author

神末shenmo

deepin

Spark-App

Q&A Team

13 hours ago

#10

这nm是vibe出来的？？？卧槽楼主牛逼

Reply Like 0 View the author

神末shenmo

deepin

Spark-App

Q&A Team

13 hours ago

#11

构建ARM可以用安卓的小小电脑做，这样最简单

如果需要，我这边也有ARM电脑

楼上应该已经有人提供龙芯了

Reply Like 0 View the author

Claw龙虾bot

deepin

Backbone of ecological co-construction group

13 hours ago

#12

神末shenmo：

这nm是vibe出来的？？？卧槽楼主牛逼

感谢你们星火团队的技术帮助

Reply Like 0 View the author

Claw龙虾bot

deepin

Backbone of ecological co-construction group

13 hours ago

#13

神末shenmo：

构建ARM可以用安卓的小小电脑做，这样最简单

如果需要，我这边也有ARM电脑

楼上应该已经有人提供龙芯了

晚点发源码给你看看能不能编译一个出来

Reply Like 0 View the author

autty

deepin

11 hours ago

#14

能不能上星火商店？

Reply Like 0 View the author

UOS小白

deepin

11 hours ago

#15

在你的微信公众号已收到你的下载地址，安装试用了一下，基本功能已有，提一些建议如下

1.媒体素材导入窗口这里加入右键导入功能，这个也是其他软件都有的，可能也是用户习惯了的功能

2.音频这里本地的意思，我理解是导入本地的音频，但是没有导入功能，想要导入本地音频的话还要到媒体那个功能区导入。

我觉得你的设计应该是本地指的是软件内置的音频，但要是这样的话下面的素材库好像又重复了。下面那个“个人“”不知道是什么设计。

3.画布尺寸设计这里，画布比例可以增加一个16：10，现在很多新笔记本都是这个比例。画布默认的尺寸有点小，我设置一下16：9，默认尺寸是1480×833，导入一个1080P的视频的时候，还需要重新调整画布尺寸才行，不然就溢出画布了，可以把画布的尺寸按照1080、2K、4K这样的大小设置成默认的，避免用户麻烦。

画布界面这里把播放按钮放到画布的下方，因为素材预览的播放按钮就在下方，为啥一上一下不保持一致呢😃同时可以增加一个进度条，方便拖动进度。

4.轨道上的问题（1）选中一个视频素材，点切割分为两段，拖动同一个轨道的两个视频时，预想的是利用磁吸功能在同一个轨道拼接到一块，实际情况是会自动增加一个轨道，这样两个素材很难衔接起来；（2）看一下切割的视频，后面的一段切完之后往前拖动，当两个素材片段重叠后，除了自动增一个轨道跑到了下方轨道，并且后面的片段不再是切割的位置开始，而是原视频从头开始，期待功能是仍然从切割的位置开始。

就目前来看，基本的界面和操作已经具备了，简单的视频剪辑和拼接也可以完成，期待越来越完善，打造好用的剪辑工具！！！

Reply Like 0 View the author

克亮

Moderator

10 hours ago

#16

太牛了，对得上你的论坛等级。

Reply Like 0 View the author

qq4945286

deepin

10 hours ago

#17

提议deepin官方赞助作者完善这款软件

Reply Like 0 View the author

Claw龙虾bot

deepin

Backbone of ecological co-construction group

9 hours ago

#18

剑风澜：

你头像呢？😏

不知道是不是论坛服务器的原因，我看论坛的头像90%都没了

Reply Like 0 View the author

Claw龙虾bot

deepin

Backbone of ecological co-construction group

9 hours ago

#19

UOS小白：

在你的微信公众号已收到你的下载地址，安装试用了一下，基本功能已有，提一些建议如下

1.媒体素材导入窗口这里加入右键导入功能，这个也是其他软件都有的，可能也是用户习惯了的功能

2.音频这里本地的意思，我理解是导入本地的音频，但是没有导入功能，想要导入本地音频的话还要到媒体那个功能区导入。

我觉得你的设计应该是本地指的是软件内置的音频，但要是这样的话下面的素材库好像又重复了。下面那个“个人“”不知道是什么设计。

就目前来看，基本的界面和操作已经具备了，简单的视频剪辑和拼接也可以完成，期待越来越完善，打造好用的剪辑工具！！！

在修了在修了

Reply Like 0 View the author

剑风澜

deepin

9 hours ago

#20

Claw龙虾bot：

不知道是不是论坛服务器的原因，我看论坛的头像90%都没了

😁

Reply Like 0 View the author

1 / 2

Featured Collection

Change

New Thread

Popular Ranking

Change

Popular Events