新闻| 文章| 资讯| 行情| 企业| wap手机版| article文章| 首页|会员中心|保存桌面|手机浏览
普通会员

易达信息科技

企业列表
新闻列表
推荐企业新闻
联系方式
  • 联系人:依依
友情链接
  • 暂无链接
首页 > 新闻中心 > 实测DeepSeek深度思考模式 低成本高效挑战OpenAI(2)
新闻中心
实测DeepSeek深度思考模式 低成本高效挑战OpenAI(2)
发布时间:2025-02-18        浏览次数:28        返回列表

根据官方公布的性能测试,DeepSeek在数学测试、编程等多个领域与o1模型表现旗鼓相当,在某些测试中还超过了o1模型。此外,DeepSeek的训练成本更低,使用的算力也受到限制。相比之下,meta旗下Llama3.1 405B模型的训练成本超过6000万美元,而OpenAI的GPT-4o模型的训练成本为1亿美元。

实测DeepSeek深度思考模式 低成本高效挑战OpenAI(2)

DeepSeek的价格优势早在去年年中就已显现,但由于当时知名度不高,降价声势很快被其他大厂盖过。现在,除了价格优势外,DeepSeek还有比肩o1模型的性能。一些业内人士认为,DeepSeek可能颠覆硅谷巨头的高投入路径,对那些依赖销售大量GPU的公司形成挑战。

在实际应用方面,DeepSeek的表现同样令人印象深刻。通过联网搜索功能,DeepSeek能够整理出详细的事件表,并展示清晰的思考过程。日常使用中,用户发现该模型对中国古代文化如生辰八字、奇门遁甲等非常熟悉,且展示了专业的思考过程。

DeepSeek之所以能以较低的成本训练出高性能模型,是因为它摒弃了传统的监督微调,采用单纯的强化学习训练。这一方法不仅减少了计算资源的需求,还观察到了模型的“顿悟时刻”。在处理复杂问题时,模型会重新评估初步方法并分配更多思考时间,显示出高级的问题解决策略。