商务服务
【人工智能】你知道什么是DeepSeek吗?你有去了解过DeepSeek吗?新手要入门DeepSeek的必经之路——初识DeepSeek
2025-02-18 18:04

【人工智能】你知道什么是DeepSeek吗?你有去了解过DeepSeek吗?新手要入门DeepSeek的必经之路——初识DeepSeek

大家好,很高兴又和大家见面啦

2025年伊始DeepSeek 在全球AI业界引发广泛关注,它以2048张H800 GPU,仅用两个月就训练出了一个媲美全球顶尖水平的模型,打破了大模型军备竞赛的既定逻辑。

DeepSeek 这款AI大语言模型,想必大家现在或多或少的都已经开始接触了,我也相信有很多大佬已经开始玩转 DeepSeek 了。

但是,我同样相信有很多朋友与我一样,之前就没怎么接触过AI软件,是一个纯新手小白。那我们应该如何入门 DeepSeek

为了帮助用户全面了解和使用 DeepSeek ,清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队推出一套学习指南——《 DeepSeek 从入门到精通2025》。

《DeepSeek从入门到精通2025》有104页,内容涵盖DeepSeek的核心技术、应用场景、提示词优化等,还介绍了如何避免AI幻觉、如何精准设计提示语等实战经验。

这份报告为用户提供了全面了解和使用 DeepSeek 的指南,有助于推动 DeepSeek 在各个领域的应用和普及。多家公司宣布将 DeepSeek 集成到自己的产品中,如中国移动的移动云全面上线 DeepSeek ,联通云基于“星罗”平台实现多规格 DeepSeek-R1 模型适配,浙文互联将 DeepSeek-R1 作为智慧内容生态平台的核心决策模型等。

我刚好获取到了这个份学习指南的PDF版,有需要的朋友可以在我CSDN的账号——【蒙奇D索大】中进行获取,并且该资源会与CSDN发布的博文进行绑定,需要的朋友可以自行下载。

在今天的内容中,我会借助这份指南与大家一起学习如何使用DeepSeek,下面我们就将开始今天的内容

Deepseek 即深度求索,既是一家人工智能公司,也是其一系列人工智能产品的名称。

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发。该公司由量化对冲基金幻方量化支持创立,于2023年7月17日在杭州市拱墅区市场监督管理局登记成立。核心团队由人工智能等领域专业人士组成,在学术和产业方面均有深厚积累。

该公司从成立以来,发布了多款语言模型

  • DeepSeek Coder:2023年11月2日发布。由一系列代码语言模型组成,在2万亿token上训练,代码占87%,有1B-33B版本。支持项目级代码补全和填充,在多种编程语言和基准测试中达开源代码模型先进性能。

  • DeepSeek LLM:2024年1月5日发布。包含670亿参数,在2万亿token数据集上训练,涵盖中英文。具备出色的推理、编码、数学和中文理解能力,在匈牙利国家高中考试中取得65分成绩,中文表现超越GPT-3.5。

  • DeepSeek Math:2024年2月5日发布。以DeepSeek-Coder-v1.5 7B为基础,在5000亿token数学相关数据等上预训练。在竞赛级MATH基准测试中取得51.7%的成绩,接近Gemini-Ultra和GPT-4性能水平。

  • DeepSeek-VL:2024年3月11日发布。开源视觉-语言模型,采用混合视觉编码器,能处理高分辨率图像,在广泛视觉-语言基准测试中性能先进或有竞争力。

  • DeepSeek-V2:2024年5月7日发布。拥有2360亿参数,中文综合能力在众多开源模型中最强,英文综合能力与LLaMA3-70B处于同一梯队,训练效率高。

  • DeepSeek-Coder-V2:2024年6月17日发布。开源混合专家代码语言模型,从DeepSeek-V2中间检查点开始,进一步预训练6万亿token,编码和数学推理能力增强,支持338种编程语言,上下文长度扩展到128K。

  • DeepSeek-V2.5:2024年9月5日发布。由DeepSeek Coder V2和DeepSeek V2 Chat合并升级,与GPT-4-Turbo等闭源模型在评测中处于同一梯队,英文综合能力与LLaMA3-70B同一梯队,在写作任务、指令跟随等多方面进行了优化。

  • DeepSeek-VL2:2024年12月13日发布。大型混合专家视觉-语言模型,在视觉问答、光学字符识别等多种任务中能力卓越,有DeepSeek-VL2-Tiny、-Small和无后缀三个变体。

  • DeepSeek-V3:2024年12月26日发布。6710亿参数的混合专家模型,激活参数370亿,在14.8万亿token上预训练。多项评测成绩超越Qwen2.5-72B和Llama-3.1-405B等开源模型,知识类任务能力显著提升。

  • DeepSeek-R1:2025年1月20日发布。在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版,通过大规模强化学习和冷启动技术,专注于推理和多模态任务。

  • Janus-Pro:2025年1月发布。多模态大模型,进军文生图领域。

现在我们已经知道了什么是 DeepSeek,那现在问题来了,我们要学习的 DeepSeek 究竟是指的该公司旗下的哪一款产品呢

这里我就不卖关子了,我们现在要学习入门的是DeepSeek-R1,这款在性能上比肩OpenAI o1的大语言模型。

DeepSeek-R1 是幻方量化旗下大模型公司DeepSeek研发的首代开源推理大型语言模型。

发布时间

  • 2024年11月20日DeepSeek-R1-Lite预览版上线网页端。
  • 2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。

模型架构

  • 采用深度Transformer架构,以DeepSeek-V3-base模型为基础,通过使用V3的数十亿参数的密集Transformer base子模型进行初始化,并利用自研的“群组相对策略优化”(GRPO)算法进行强化学习训练。

训练方法: 训练流程采取多阶段逐步增强策略,包括冷启动监督微调、第一阶段强化学习、拒绝采样与二次监督微调、第二阶段强化学习。

R1 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景

支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。

以文本生成为例,我们可以通过下面的这个UML图来进行展示

在整个文本生成的过程中R1 主要进行3件事

  1. 将文本需求进行识别与处理
  2. 在知识库中查找与处理结果相对应的知识数据
  3. 将获取到的知识数据返回给用户

R1 在实际的使用中,能应用于多种场景,主要有以下几方面

生活场景

  • 生活助手:可以帮用户制定旅行攻略、翻译菜单、学习地方麻将规则等。

  • 人生决策辅助:通过分析用户提供的信息,为用户提供事业、学业等方面的建议和决策参考,比如根据生辰八字分析运势。

  • 创意创作:网文作者可以依靠它实现快速写作,还有网友开发出了“AI对联生成”等玩法。

工作场景

  • 科创情报分析:智慧芽接入DeepSeek-R1后,能帮助用户更精准快速地获取专利、论文等多维度科创信息,深入把握技术演进逻辑和竞争格局,优化知识产权布局。

  • 医疗辅助:智云健康将DeepSeek-R1接入其医疗AI系统“智云大脑”,可提升医院和药店SaaS的慢病管理效率。

  • 证券金融:可以尝试用于分析股市走势等金融数据,为投资者提供一定的参考。

学习场景

  • 数学问题求解:能解决高中及以上难度的数学问题,可展示逐步解题过程,帮助用户理解数学原理。

  • 编程辅助:可进行代码生成、代码纠错等编程相关任务,比如根据需求编写Python脚本。

  • 语言学习:能进行语言翻译、语法讲解、语言表达润色等,辅助用户学习各种语言。

通用场景

  • 信息检索与整合:具备类似ChatGPT的网络搜索功能,能快速检索和整合互联网上的信息,为用户提供全面准确的答案。

  • 文本处理与分析:可以对输入的文本进行理解、分析、总结、生成等操作,如对PDF文件内容进行提取和分析。

在今天的内容中我们通过3个问题来认识了DeepSeek


  1. 什么是DeepSeek

DeepSeek 即深度求索,既是一家人工智能公司,也是其一系列人工智能产品的名称。

  1. 什么是DeepSeek-R1

DeepSeek-R1 是幻方量化旗下大模型公司DeepSeek研发的首代开源推理大型语言模型。

  1. DeepSeek-R1 能够做什么

R1 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景

支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。


今天的内容到这里就全部结束了,通过今天的内容,我们对 DeepSeek 以及 R1 做了一个细致的了解。如何使用 R1 则是我们目前急需学习的内容,在后续的篇章中,我将陆续更新 R1 的使用方法,大家记得关注哦

    以上就是本篇文章【【人工智能】你知道什么是DeepSeek吗?你有去了解过DeepSeek吗?新手要入门DeepSeek的必经之路——初识DeepSeek】的全部内容了,欢迎阅览 ! 文章地址:http://xiaoguoguo.dbeile.cn/news/7224.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多   
最新新闻
deepseek使用教程 vscode
标题“websocket包”指代的是一个在计算机网络技术中应用广泛的组件或技术包。WebSocket是一种网络通信协议,它提供了浏览器与服
门店拓客系统搭建门店引流管理系统
门店拓客系统开发详询吴经理,门店拓客系统商城,门店拓客管理系统(悦丹系统开发)。在产业互联网的生态下,产业系统中的供应链
初一为什么吃饺子?吃饺子的由来及包饺子小窍门
过年为什么吃饺子?  一是按照古代的习俗,饺子是过年祭祀后食用的食品。过年时,讲究守岁时包,辞岁时吃,即到子时吃,此时为
揭秘AI搜索新生态:DeepSeek与百度的对比分析
近年来,随着人工智能技术的飞速发展,搜索引擎的市场格局开始发生微妙的变化。特别是挑战传统搜索引擎的AI驱动型平台如DeepSeek
百度答题赚钱怎么做?百度答题利用AI辅助赚取稳定收益完整攻略
关键这是一个长期的项目,在圈内很多人收费大部分的价位是300~1000元不等。今天海哥就来拆解如何利用AI进行百度问题获取收益的完
创新智能设备AI助手:无法错过的高效生活必备工具
在快速发展的智能设备市场中,AI助手的创新技术为用户带来了显著的生活改变。最新推出的智能设备——AI助手Pro,不仅具备高效的
超ChatGPT,DeepSeek成全球增速最快AI应用!国产AI黑马是如何炼成的
DeepSeek作为国产AI应用,自2025年1月11日上线以来,全球日活跃用户突破2215万,成为增速最快的AI应用。其成功吸引了芯片巨头如A
上影厂33位老演员,出生50年代,8位美女走出3位影后
原创 DJ雅清 老电影的那些事今天请大家欣赏昔日上影厂33位老演员的明星老照片。他们全都出生于50年代,个个演技精湛,但男星大多
DeepSeek和豆包哪个更适合普通人?用了几个月,说说我的真实感受
我是一名IT软件工程师,在过去几个月里同时体验了国内两款热门AI工具——DeepSeek和豆包,这两者其实对于我来说日常更多应用于模
探究AI工具的无限可能:从绘画到写作,让你的创作更轻松
随着人工智能(AI)技术的迅猛发展,AI工具在艺术创作和内容生成领域展现出不可思议的潜力。从AI绘画到AI写作,我们可以看到越来