DeepSeek的一次小更新,堪比发布新模型

日期: 2025-03-25 | 来源: 差评 | 有0人参与评论 | 字体: 小中大
一个好消息，时隔俩月， DeepSeek 终于更新了。

就在昨天晚上， DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。

模型参数 6850 亿，跟上一个版本的 V3 （ 6710 亿）相差不大，采用 MoE 架构，还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明， DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强，写作风格实现了跟 R1 对齐，另外还有一些其他方面的小优化。

现在打开 DeepSeek 官网，把深度思考模式关掉就能直接用上 V3-0324 。

不过有一说一，虽然 V3-0324 仅仅只是 V3 的小版本升级，并不是大伙儿期待已久的 V4 或者 R2 ，且官方账号也没有发布任何跟模型有关的信息。

但也丝毫不妨碍， V3-0324 一上线，就有人说他的代码能力，直追克劳德。

新版本的模型刚一上传，就登上了 Hugging Face 的趋势榜单。

在国外大模型竞技场 KCORES 的测评中， V3-0324 的代码能力得分 328.3 ，超过了普通版的 Claude 3.7 Sonnet 的 322.3 分，接近 Claude 3.7 Sonnet 思维链版本的 334.8 分，排名第三。

图源 @karminski 牙医

重点是，排名在前面的模型压根就没几个开源免费的， V3-0324 可谓是一枝独秀。

所以在 V3-0324 上线不到一天的时间里，就已经有很多老哥迫不及待上手测评了一波。

这么说吧， V3-0324 在这些人手里，已经成了拳打 o3-mini ，脚踢 Claude 3.7 Sonnet 的存在。

经典的小球弹跳测试中，这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论