AI大模型202605使用体验总结

经过一个月相对高强度试用各家模型（主要是GLM5.1、DeepSeekV4Pro&Flash、MiMo2.5Pro、MiniMax-M3），期间主要进行：需求迭代、逻辑优化、BUG修复、代码分析、文档总结&生成等，总结一下各家套餐和模型的消耗与表现。

付费方案

涉及：阿里云Token Plan、MiMo Token Plan、OpenCode Go、GitHub Copilot、DeepSeek按量付费。

此外之前用的TraeCN虽然免费，但由于排队越发严重（一次对话1小时左右），并且相同模型下Agent质量明显不如Claude Code等，所以这个月用的少。

Claude Opus理论上是效果最好的，不过上述方案只在GitHub Copilot中提供，10分钟基本上就跑完一个月额度了，所以基本不可用，测试不足。

国模里GLM5.1效果最好，基本不会因为模型问题而导致无法完成。

其次是DeepSeek V4 Pro，大部分时候可以用较短的提示词来实现需求，不过遇见复杂逻辑，尤其设计Lua与蓝图&C++交互时，效果会比较差，需要自己完成一些相关调用或明确在提示词里指挥怎么做。

再然后MiMo2.5Pro&MiniMax-M3虽然媒体评测尚可，但个人体验在编码方面体验一般，生成的产物很多都不可用。

DeepSeekV4Flash没有作为主力模型，但是胜在非常便宜，OpenCode中甚至限免，所以也值得一试。

由于贵的模型速度慢，便宜的模型质量差，所以花在重试和迭代提示词的时间会特别严重，尤其对于一些简单修改，可能效率仍不如人工，整体来看花在编程本身的用时很多地方没有质变。但是确实可以解放很多心智负担，而且可见的随着模型和工具的迭代体验能更好。

GitHub Copilot（129/月）在改版之后性价比最低，几乎不可用。

阿里云Token Plan （198/月）主要在用GLM5.1，由于不限制小时额度和周额度，体感是3天高强度就可以用满整个月的额度。

MiMo Token Plan Lite（39/月）主要使用MiMo2.5Pro，消耗速度适中，但模型效果不太好。

OpenCode Go（10美元/月）主要使用GLM5.1，体感消耗比阿里云Token Plan要耐用，不过由于有5小时和周限制，日常开发时没法每天都全力用，可能1小时就能用满5小时的额度，而每次都用满的话可能也就能支持5天用满月额度，还需要分2周来避免周限制。

所以最终体验下来可能还是DeepSeekV4Pro能满足日常使用，质量和价格都还算能接受，从这个月按量付费的用量来看一天5~20块，平均10块/天，所以后续可能还是会以这个为主。

后续据说GLM5.2要出了，可能得观察观察表现，而且随着对大模型的要求也越来越高了，可能结论每个月还需要更新。