经过一个月相对高强度试用各家模型(主要是GLM5.1、DeepSeekV4Pro&Flash、MiMo2.5Pro、MiniMax-M3),期间主要进行:需求迭代、逻辑优化、BUG修复、代码分析、文档总结&生成等,总结一下各家套餐和模型的消耗与表现。
付费方案
涉及:阿里云Token Plan、MiMo Token Plan、OpenCode Go、GitHub Copilot、DeepSeek按量付费。
此外之前用的TraeCN虽然免费,但由于排队越发严重(一次对话1小时左右),并且相同模型下Agent质量明显不如Claude Code等,所以这个月用的少。
效果方面
Claude Opus理论上是效果最好的,不过上述方案只在GitHub Copilot中提供,10分钟基本上就跑完一个月额度了,所以基本不可用,测试不足。
国模里GLM5.1效果最好,基本不会因为模型问题而导致无法完成。
其次是DeepSeek V4 Pro,大部分时候可以用较短的提示词来实现需求,不过遇见复杂逻辑,尤其设计Lua与蓝图&C++交互时,效果会比较差,需要自己完成一些相关调用或明确在提示词里指挥怎么做。
再然后MiMo2.5Pro&MiniMax-M3虽然媒体评测尚可,但个人体验在编码方面体验一般,生成的产物很多都不可用。
DeepSeekV4Flash没有作为主力模型,但是胜在非常便宜,OpenCode中甚至限免,所以也值得一试。
效率方面:
由于贵的模型速度慢,便宜的模型质量差,所以花在重试和迭代提示词的时间会特别严重,尤其对于一些简单修改,可能效率仍不如人工,整体来看花在编程本身的用时很多地方没有质变。但是确实可以解放很多心智负担,而且可见的随着模型和工具的迭代体验能更好。
价格方面
GitHub Copilot(129/月) 在改版之后性价比最低,几乎不可用。
阿里云Token Plan (198/月)主要在用GLM5.1,由于不限制小时额度和周额度,体感是3天高强度就可以用满整个月的额度。
MiMo Token Plan Lite(39/月) 主要使用MiMo2.5Pro,消耗速度适中,但模型效果不太好。
OpenCode Go(10美元/月) 主要使用GLM5.1,体感消耗比阿里云Token Plan要耐用,不过由于有5小时和周限制,日常开发时没法每天都全力用,可能1小时就能用满5小时的额度,而每次都用满的话可能也就能支持5天用满月额度,还需要分2周来避免周限制。
所以最终体验下来可能还是DeepSeekV4Pro能满足日常使用,质量和价格都还算能接受,从这个月按量付费的用量来看一天5~20块,平均10块/天,所以后续可能还是会以这个为主。
后续据说GLM5.2要出了,可能得观察观察表现,而且随着对大模型的要求也越来越高了, 可能结论每个月还需要更新。