米兰·(milan)中国官方网站-DeepSeek研究员称R1训练仅用几周接下来还有大招

你在找什么？

首页新闻中心企业动态详情

2025-12-24

　　【米兰·(milan)中国官方网站科技消息】近期，科技界最为热议的词汇非“DeepSeek”莫属。据悉，DeepSeek-R1在数学、代码自然语言推理等领域的表现，已经能够与OpenAI的GPT-1正式版相媲美，其火爆程度席卷全球。而最近，DeepSeek的研究员在线透露了一个消息：R1的训练过程仅仅耗时两到三周，研究员们在春节期间也未停歇，继续全力推进研究，接下来还有大招。

DeepSeek研究员称R1训练仅用几周接下来还有大招

　　几天前，Daya Guo发布了一条推文，分享了他春节期间最为兴奋的事情——亲眼目睹了R1-Zero模型性能曲线的“持续增长”，并深切感受到了强化学习（RL）的强大力量。在回复网友关于DeepSeek R1的问题及公司后续计划时，Daya Guo透露，DeepSeek的R1只是一个开始，内部研究正在快速推进。他强调，研究员们在春节期间一直在加班加点地推进研究。

DeepSeek研究员称R1训练仅用几周接下来还有大招

　　对于网友提问的“如果不是秘密的话，这次RL训练跑了多久？”Daya Guo回应称，660B参数的R1-Zero和R1是在V3版本发布后才开始训练的，整个过程大约花费了2-3周的时间。此外，他还透露团队正在尝试将R1应用于形式化证明环境，并希望尽快向社区发布更加优秀的模型。从Daya Guo的言辞中不难看出，他们在这方面已经取得了进展，未来或将有更多重量级的模型问世，令人充满期待。

-米兰·(milan)中国官方网站

获取方案

咨询

获取方案

提交信息后，业务人员将尽快与您联系

* 请选择方案领域

电话咨询在线咨询免费方案

联系我们

用微信扫一扫，关注我们取得联系

021- 3782 9910 电话

18916808200 热线

sales@ 合作邮箱

tech@ 售后邮箱

hr@ 简历投递

我们的工作时间是周一至周五上午 9 时至晚上 6 时（不含公共节假日）。我们仅在工作时间接听您的来电。
若您在非工作时间发送微信消息，我们将在工作时间回复您。