-
日期: 2025-02-19 | 来源: 字母榜 | 有0人参与评论 | 字体: 小 中 大
对开发者而言,长时间的服务异常不再是简单的故障,而演变成为代码世界和商业逻辑间的裂缝,他们被迫在迁移成本下进行生存演算,无论是涌入,还是逃出,开发者们都需要面对DeepSeek爆火带来的余震。
春节期间小程序后台被迫瘫痪三天后,至大年初六,为了保证程序正常运转的林森,离开已经部署一年多的DeepSeek,转回了ChatGPT。
即使API调用价格高了近10倍,但此时保证服务的稳定,成了优先级更高的选项。
值得注意的是,开发者离开DeepSeek转向其他大模型,并不如用户在APP内切换调用模型一般轻松。 “不同的大语言模型,甚至是同一个语言模型的不同版本,对于提示词的反馈结果都有细微的差别。”即便林森仍在持续调用ChatGPT,将所有关键节点从DeepSeek迁移ChatGPT,并保证稳定且高质量的内容反馈,仍然花了他半天多的时间。
切换这个动作本身也许只需要两秒钟,但“更多开发者,换一个新模型要花上一个星期反复调整提示词,并重复测试。”林森告诉字母榜,
在林森这样的小开发者们看来,DeepSeek服务器不足可以理解,只是如果能提前通知,能避免许多损失,无论是时间成本,还是APP维护成本。
毕竟, “登录DeepSeek开发者后台需要手机号注册,只需要一个短信,就可以提前告知开发者。”如今,这些损失将由曾在DeepSeek默默无名时就开始支持他们的开发者自己承担。
当开发者和某个大模型平台深度耦合,稳定性无疑成了不必宣之于口的契约,一个频繁波动的服务接口,足以让开发者重新审视对平台的忠诚度。
就在去年,林森在调用Mistral大模型(法国头部大模型公司)时,因为Mistral账单系统错误而重复付费,在他发出邮件后,Mistral不到1小时就纠正了问题,并附上了100欧元的代金券作为赔偿。这样的应对,也让林森产生了更多信任。如今,他也将一部分服务迁回到了Mistral。
易标AI技术总监杨惠超则在DeepSeek V3 版本发布之后,就开始酝酿一场逃离。
不用DeepSeek来写诗或者吐槽,如果用DeepSeek来写标书呢?负责公司内AI标书项目的杨惠超,在DeepSeek推出V3版本后已经着手寻找替代方案。对他来说,在标书这样的专业领域,“DeepSeek稳定性越来越不足。”
DeepSeek R1版本火出圈的推理能力,并不吸引杨惠超。毕竟, “作为开发者,软件主要的推理能力是靠程序和算法,并不是太依靠模型的基础能力。底层即便用最老的GPT 3.5,依靠算法纠正都可以产出一个很好的结果,模型只要回复答案稳定就可以。”
在实际调用过程中,DeepSeek在杨惠超眼中,似乎更像是一个聪明却会偷懒的“好学生”。
升级V3版本后,杨惠超发现,DeepSeek对一些复杂问题有了更高的回答成功率,但稳定性却也攀升到了难以接受的程度,“现在问10条问题,至少有一条输出不稳定,在要求生成的内容之外,DeepSeek往往喜欢自由发挥,额外生成和问题无关的内容。”
比如,标书内不允许出现错误字符,同时,大模型返回的结果,开发者们往往指定用Json 结构(用指令每次调用大模型使得稳定返回固定字段)去输出数据,便于后续函数调用,但出现错误或者不准确,都会导致后续调用失败。
“DeepSeek R1,或许相对此前的V3版本,推理能力提升了很多,但是稳定性达不到商业化的水准。”在@生产力Mark账号内,杨惠超提到。
图注:DeepSeek V3生成过程中出现乱码
图源:@生产力Mark账号- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见