DeepSeek V4第一波测评如何？

内容分享3个月前发布

9 0 0

V4预览版刚上线一天多，代码能力成了最炸的卖点。内部测评说体验超过Sonnet 4.5，交付质量接近Opus 4.6非思考模式。

世界知识测评也大幅领先其他开源模型。但第三方用户普遍反馈体感更偏工程向，复杂的逻辑推理还是得等思考模式出来才稳。那些指望V4一出就把Claude和GPT摁在地上摩擦的，目前来看还不太现实。

DeepSeek V4第一波测评如何？

从公布出来的数据看，V4-Pro-Max在竞赛数学基准HMMT拿到95.2分，跟Opus-4.6 Max的96.2分只差了1分，紧追顶级闭源模型梯队。但不管是内部数据还是民间测评，都承认它跟Opus 4.6的思考模式依然有差距。

百万上下文早就成了标配，各家都一样。V4这次定价的确有杀伤力，成本压到极致。但想成为“Claude杀手”，光靠便宜还不够，推理能力里那种“机灵感”，是最难抄作业的部分。希望下次迭代能把思考模式的短板彻底补齐。

DeepSeek V4第一波测评如何？

#头条创作训练营##DeepSeek##GPT#

内容分享

文章版权归作者所有，未经允许请勿转载。

OpenClaw爆火！拆解 AI Agent 通用架构，看懂下一代 AI 应用核心逻辑

内容分享

3个月前

0120

GPU新股一天狂飙568%，中一签怒赚30万！真正的大佬却悄悄转战…

内容分享

4个月前

060

使用DeepSeek和豆包重读《飞鸟集》之二百三十：玫瑰

内容分享

4个月前

070

Mistral AI狂扫13800块GB300 欧洲AI要改写格局？

内容分享

3个月前

080

暂无评论

暂无评论...

DeepSeek V4第一波测评如何？

AI Agent智能体：从入门到精通，2026年最值得掌握的人工智能技术

Claude降智，是自杀还是装死？

相关文章

OpenClaw爆火！拆解 AI Agent 通用架构，看懂下一代 AI 应用核心逻辑

GPU新股一天狂飙568%，中一签怒赚30万！真正的大佬却悄悄转战…

使用DeepSeek和豆包重读《飞鸟集》之二百三十：玫瑰

Mistral AI狂扫13800块GB300 欧洲AI要改写格局？

暂无评论

热门网站

微信公众平台

FreePD

慕课网

微信网页版

腾讯会议

蓝湖

热门文章

阿里通义灵码上线，国服三大玩家集结AI编程，围剿美国Cursor，打得过吗？

VirtualXposed hook Android系统方法

内部系统越权访问频发？企业权限测试：从员工到管理员权限核查

实现无瘤奇迹！多款ADC药精准爆破肿瘤细胞，改写6大癌种生存结局

中高考英语必备核心语法考点地点状语从句详解及双语例句

2025年必收！全网最全AI神器集合~1

DeepSeek V4第一波测评如何？

AI Agent智能体：从入门到精通，2026年最值得掌握的人工智能技术

Claude降智，是自杀还是装死？

相关文章

热门网站

微信公众平台

FreePD

慕课网

微信网页版

腾讯会议

蓝湖

热门文章

标签云