DeepSeek版o1发布，数学与编程超越OpenAI，每天免费50次测试

DeepSeek版o1发布，数学与编程超越OpenAI，每天免费50次测试

2025-03-27 19:35

近日，AI领域迎来了一个重要的新晋玩家——DeepSeek版o1，该模型命名为DeepSeek-R1-Lite。根据最新发布的信息，这一模型在数学和编程任务上的表现超过了OpenAI的o1-preview，令业内人士和用户倍感兴趣。当前，用户可以通过官网免费测试这一预览版模型，每天提供50次使用机会，吸引了许多AI爱好者前来体验。

DeepSeek-R1-Lite采用了强化学习技术，注重推理过程中的自我反思与验证，体现出新的Scaling Laws，即推理越长，表现越佳。在最近的AIME测试中，随着计算时间的增加，该模型的得分呈现出稳步提升的趋势，显示出其在解决复杂问题时的潜力。有用户分享了具体的测试案例，强调了该模型在数字密码破解方面的能力。

在一项密码推理任务中，DeepSeek-R1-Lite成功解出正确密码3841，而OpenAI的o1-preview未能解出，展现出其在数学推理上的优势。用户反馈称，该模型在数学问题上的表现令人满意，基准测试结果也支持了这一点。

然而，模型在编程任务中的表现并不尽如人意。某用户尝试生成一个用于转置矩阵的bash脚本时，DeepSeek-R1-Lite未能解决问题，而o1模型则表现得更为出色。这显示出在编程任务的复杂性和知识背景理解上的短板。此外，用户还遇到了一些更高级的知识推理问题，DeepSeek-R1-Lite的表现同样不够理想。

值得注意的是，DeepSeek团队在此模型上进行的优化主要集中在数学和编程任务上。一些用户指出，这种具有明确优化方向的模型在特定领域显示出了不错的表现，但整体而言仍有待提升，尤其是在复杂推理和现代知识引用方面。

尽管DeepSeek-R1-Lite在一些任务上还未能达到完美，其设计理念和持续迭代的发展方向显示了极大的潜力，尤其是当其未来版本公开时，更有可能吸引大量开发者和研究人员积极参与。

此外，模型的游戏能力也引发了热议。一些用户尝试用其玩井字棋（tictactoe），发现模型有时未能表现理想，但也有用户反馈新模型经过多次尝试后能够稳定作出正确结果。这种学习的过程同样反映出AI模型在逐渐成长与完善。

当前，DeepSeek-R1-Lite仍处于不断发展阶段。官方已表示，未来会将正式版DeepSeek-R1完全开源，包括技术报告和API共享，这一举动将在AI社区内激发更大的讨论和参与热情。对于喜欢深度学习和AI开发的用户而言，这无疑是一个不容错过的机会。

以上就是本篇文章【DeepSeek版o1发布，数学与编程超越OpenAI，每天免费50次测试】的全部内容了，欢迎阅览！文章地址：http://xiaoguoguo.dbeile.cn/news/8568.html
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多