BT财经

境内金融信息服务备案编号:

【京金信备(2021)5号】

2026年05月14日

DeepSeek V4的Agent能力是开源第一——但还有一件事,悄悄变差了

 

 

4月24日,DeepSeek V4正式开源发布。海外AI社区48小时内完成了第一轮系统性评测。

结论出来了,但出乎很多人意料。好消息是:V4-Pro在智能体(Agent)任务上排名所有已公开开源模型第一。坏消息是:它的幻觉率,比上一代有所上升。

这两件事放在一起,值得认真解读一下。

幻觉率是什么,为什么企业端比个人用户更在乎

「幻觉」是AI领域的专业术语,指的是:当模型不知道答案时,它会编造一个听起来很像真的回答,而不是说「我不知道」。注意:幻觉率94%,不是说V4有94%的回答是错的——它的含义是,在那些它本来不确定的问题上,有94%的概率选择给出回答而非拒绝回答。这个区别很重要。



未完......
请加入BT财经数据通会员查看全文!
加入BT财经数据通会员 >>




版权声明:本文版权归BT财经所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

北京领讯时代信息技术有限公司 | Copyright ©️ 2026 财经时报 版权所有 京ICP备19043396号-7

京公网安备 11010602007380号 | 境内金融信息服务备案编号:京金信备(2021)5号

网信算备110106674807801230011号


声明:未经授权,不得复制、转载或以其他方式使用本网站的内容。BT财经尽最大努力确保数据准确,但不保证数据绝对正确。