凯发天生赢家一触即发首页

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeek R1幻觉率降低,用户喊话:想要R2

2025-06-02 16:11:36
来源:

猫眼影戏

作者:

黄土塬

手机检察

  猫眼影戏记者 张景辉 报道w3u7903ejky2ywls

2025.05.29

本文字数:1440,阅读时长约莫2分钟

导读:报告显示此前 R1模型幻觉率在21%左右。

作者 |第一财经 刘晓洁

在开源平台HuggingFace上宣布R1模型的更新后,5月29日晚,DeepSeek终于宣布了官方通告介绍这次版本的具体能力迭代细节,其中包括深度思考能力强化、幻觉改善和创意写作更好等。

在测评数据上,官方体现,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了目今海内所有模型中首屈一指的结果,并且在整体体现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

值得一提的是,DeepSeek提到,新版DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%-50% 左右,能够提供更为准确可靠的结果。

所谓幻觉即大模型的“乱说八道”,此前DeepSeek的幻觉率并不低,也被不少用户和开发者所讨论。5月15日,SuperCLUE曾宣布最新一轮中文大模型忠实性幻觉测评结果,显示此前的DeepSeek-R1模型幻觉率在21%左右,在测评的海内模型中排名第五。

据SuperCLUE,推理模型的幻觉比非推理模型更显著,在他们的测评中推理模型的平均幻觉率为22.95%,非推理模型的平均幻觉率为13.52%。

除了幻觉方面的改善,官方介绍,新R1模型在庞大推理任务中的体现有了显著提升。例如在 AIME 2025 测试(一个数学基准测试,用于模型在数学推理方面的能力)中,新版模型准确率由旧版的70%提升至87.5%。

别的,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时泛起出越发贴近人类偏好的写作作风。

在官方发文之前,众多测试标明R1新模型的代码能力有显著提升,在代码测试平台Live CodeBench中,其性能险些媲美OpenAI重量级的o3-high模型。官方此次通告也提到,在前端代码生成、角色饰演等领域,模型的能力确实均有更新和提升。

在迭代路径上,DeepSeek体现,DeepSeek-R1-0528 仍然使用 2024 年12月所宣布的DeepSeek V3 Base模型作为基座,但在后训练历程中投入了更多算力,显著提升了模型的思维深度与推理能力。

本次R1新模型参数为 685B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。同时,与旧版本的R1坚持一致,此次开源模型权重仍然统一接纳 MIT License,允许用户利用模型输出、通过模型蒸馏等方法训练其他模型。

有趣的是,在X平台DeepSeek的官方评论区中,讨论的话题全都关于R2模型,“We want R2(我们想要R2模型)”,有用户评论称。业界对DeepSeek下一代的模型期待已久。

基于DeepSeek刚刚宣布了更新,有用户推测,“是否意味着我们暂时不会听到有关R2的消息?”也有用户挖苦称,这一模型或许在开发中应该是R2,可是当他们发明在基准测试中没有逾越OpenAI的o3 时,DeepSeek将其重新命名为R1的更新。

一向低调的DeepSeek并未对外界的推测进行任何回应,基于R1是在V3模型的基础上训练的,或许我们会先比及V4模型的更新。无论如何,海内外大模型领域的基座模型大战还在继续,DeepSeek之后,谁会是下一家?

外洋网友制作的梗图,对目今大模型领域的密集更新进行挖苦

微信编辑| 苏小

??时事1:龙珠18号被爆❌羞羞视频

??06月02日,让“银发族”搭上数字化快车,

  许多人都有一种不真实的感受,他们费尽力气大战凶狈,险死还生,结果狈村的祭灵却被一条绿莹莹的柳枝直接洞穿。

,freeHD❌❌❌中国麻豆黑料。

??06月02日,山东半岛“慢节奏”滨海度假游受热捧 游客“慢享”赶海垂钓乐趣,

  1 、城北西区,财产新洼地

,动画埃及猫拔萝卜原创版视频,香港摄′像师给白虎裸模拍写真老牛传媒有限公司,免费静香被强❌禁欲小说。

??时事2:小杰被奇犽C

??06月02日,中新健康丨推动上海社区康复服务高质量发展,“台湾经验”如何借鉴?,

  “不怕坏了大荒规则,被各村各族群起而攻之吗?”石云峰冷漠的说道。

,扒开❌狂揉❌喷水无需登录,羞羞漫画❤️在线入口,男男GAY✅打屁屁网站。

??06月02日,外交部:期待并鼓励中美两国人民多走动、多往来、多交流,

  小不点喜悦,脸上挂着甜笑,大眼弯成了月牙状,无比的开心,他一下子晋升为洞天中期的妙手。

,灰原哀被狂揉下部❌,像素JamesCabello下载,国产在线㊙️麻豆精品观看。

??时事3:精品➕无码➕在线观看

??06月02日,候鸟的旅行箱丨第十八集:大雪,

  “这是教训啊,肯定是某个王侯家的子弟,不知道天高地厚,跑到西疆去乱来,这不是坑祖吗?一族人都会被搭进去啊。”

,女人下面被添全过程A片,挠男男tk网站入口,美女被❌到爽🔞高潮草莓软件。

??06月02日,第十一届中国—中亚合作论坛达成合作项目金额112亿元,

  “噗”的一声,他的小半边身子炸开了,剧痛让他颤抖,符文立即就被磨灭了,难以起效果,眼中写满了惊恐。

,美女被❌狂揉大胸视频,LOL女英雄18禁无遮挡图,成人黄www…。

??时事4:腹肌小奶狗导管

??06月02日,京沪鲁携手开展核能公众沟通 激发年轻人对“硬核”知识的兴趣,

  在此,我谨代表数信学院,向前来领导我们消防知识并指导我们演练的守卫处同志体现热烈的接待!对守卫处一直以来对我院消防以及治安等事情的大力支持体现衷心的谢谢!

,高跟鞋扫楼打胶鞋网站,8-10岁幼儿超清区,大胸美女❌❌❌奶头。

??06月02日,【洋腔队】以汉为名:跨越大洋的汉语教学之旅,

  它恼怒的嚎叫,在上空盘旋,可是其他巨兽另有凶狼却不敢攻击了,没有立刻执行它的命令,对小不点手中的祖器惊惧。

,A片⭕⭕⭕⭕XXXX受爽直播,白襪體育生自慰打飛機网站,本子全彩ACG⭐️无翼乌大全。

责编:吴京早

审核:任熊

责编:侯磊

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳许可证 - 音像制品出书许可证 - 广播电视节目制作经营许可证 - 网络视听许可证 - 网络文化经营许可证

山东省互联网传媒集团主办  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图