当前位置: CNMO > 人工智能 > 人工智能新闻 > 人工智能消息 > 正文

DeepSeek-R1-0528更新了什么?官方公布细节了

CNMO 【原创】 作者:石张钰 2025-05-29 21:02
评论(0
分享

  【CNMO科技消息】近日,DeepSeek R1模型迎来重要升级,最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程,显著提升了模型的思维深度与推理能力,在多个领域展现出更优异的性能。

DeepSeek-R1-0528更新了什么?官方公布细节了

  在深度思考能力方面,DeepSeek-R1-0528以2024年12月发布的DeepSeek V3 Base模型为基座,投入更多算力进行优化。这使得新模型在数学、编程和通用逻辑等多个基准测评中表现卓越,成绩位居国内模型前列,并接近国际顶尖水平,如o3与Gemini-2.5-Pro。特别是在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%,显示出在复杂推理任务中的显著进步。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考,平均每题使用的tokens从12K增加到23K。

DeepSeek-R1-0528更新了什么?官方公布细节了

  除了深度思考能力的提升,DeepSeek-R1-0528还在其他方面进行了优化。针对“幻觉”问题,新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%~50%,提供了更为准确、可靠的结果。在创意写作方面,新模型针对议论文、小说、散文等文体进行了优化,能够输出篇幅更长、结构更完整的长篇作品,且风格更贴近人类偏好。

  此外,DeepSeek-R1-0528还支持工具调用功能,尽管不支持在thinking中进行工具调用,但在Tau-Bench测评中表现良好,与OpenAI o1-high相当。同时,新模型在前端代码生成、角色扮演等领域的能力也有所提升。

DeepSeek-R1-0528更新了什么?官方公布细节了

  API方面,DeepSeek-R1-0528已同步更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。官方还调整了max_tokens参数的含义,用于限制模型单次输出的总长度,包括思考过程。

分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
火热围观
潮机范儿

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号