• 正文
    •   AI大模型:知识渊博却缺“实战”的大学生
    •   大模型训练:海量数据铸就智慧“大脑”
    •   MoE架构:让大模型“术业有专攻”
    •   如何用好AI大模型:像老师傅带新人一样训练它
    •   AI时代,我们如何自处?
  • 相关推荐
申请入驻 产业图谱

与AI共处 — 喂Ta,养Ta,利用Ta

03/06 14:30
822
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

在刚刚过去的春节,科技圈最火的话题非DeepSeek莫属,不少人将其视作影响国运的重磅产品,各行业的公司都纷纷接入,一时间风头无两。近来一直关注着AI领域的各种产品,从最初只是下载几个AI APP当作高级搜索引擎,偶尔用它处理些文字工作,到如今深入研究,对AI大模型的理解也在逐步加深。

  AI大模型:知识渊博却缺“实战”的大学生

在我看来,AI大模型就像一位刚从名校毕业的大学生,饱读诗书,学习过海量公开资料和信息,逻辑推理能力也十分出色,既能陪你谈天说地,又能随时提供各类知识与数据。可它有个明显短板,就是缺乏专业领域的历练。像DeepSeek、ChatGPT这些大模型,专业知识储备不足,很难直接应用到具体技术开发工作中。尽管我们看到AI在蛋白质结构探索、新材料研发、医疗诊断等领域有成功案例,但这背后都是专业团队长期对模型进行专门训练,并开发相应应用程序的成果。

  大模型训练:海量数据铸就智慧“大脑”

大模型训练中,数据准备至关重要,一般分为公开语料和专有数据。公开语料来源广泛,像Common Crawl这个非营利组织,致力于用大规模分布式爬虫系统定期抓取整个Web,并把原始数据(约300TB)存储在可公开访问的数据库中;Wikipedia约20GB的精选文本;BooksCorpus这个由开发者soskek创建的多语种书籍语料库,整理了约11,000本书籍,方便研究者和开发者用于训练和验证NLP模型;还有BigQuery从GitHub获取的代码。专有数据则依据训练目的和领域而定,常见的是企业内部文档(需合规清洗)和学术论文(如arXiv等开放资源)。这就好比人类学习,想成为文学家或专家,得先熟读大量书籍,站在巨人肩膀上。“熟读唐诗三百首,不会作诗也会吟”“观千剑而知器”说的就是这个道理。我们把大模型核心的神经网络想象成大脑,每个参数如同人脑神经元,参数(神经元)越多,理论上大模型(大脑)的知识就越丰富,也就越聪明。所以现在主流大模型如ChatGPT、GROK和DeepSeek等参数量都在万亿左右。

  MoE架构:让大模型“术业有专攻”

人再聪明也不可能样样精通,顶级数学家很难同时是历史学家,机械工程师也难以成为优秀外科医生。AI大模型也是如此,所以DeepSeek采用了MoE(Mixture-of-Experts,混合专家)模型架构。换成人话就是:先用一个语言大模型处理用户输入,遇到语言大模型处理不了的专业领域问题,就调用医学、建筑学等附属专家模型。这就像大脑和小脑的分工协作,大脑负责认知、情绪调控和决策,小脑在运动协调、学习记忆和时间感知中发挥作用,配合起来效率更高。

  如何用好AI大模型:像老师傅带新人一样训练它

以我的经验,使用大模型就像领导带新人,也和老师傅带刚毕业的大学生类似。假如你是老师傅,领导分配来一个名校毕业的研究生,你得先给他介绍公司产品、业务、流程和岗位工作内容,再给他一堆技术文档让他自学,接着一点点传授工作中的具体操作步骤、专用工具使用方法等,工作中还要及时发现他的问题并帮他提升。使用大模型也是这个流程,要输入海量本领域专业知识对其训练,检查输出,调整输入重新训练,开发接口程序让模型投入实际工作,而且这个过程可能要不断重复,才能让系统达到最佳效果。模型最终能否达到预期,不仅取决于自身算法和结构,更取决于训练它的人。就像天资聪慧的毕业生,若师傅水平有限,几年后也可能碌碌无为。对模型进行训练的能力不足,模型输出就会和期望相差甚远。

此外,使用模型的人需要具备准确描述目的的能力。爱因斯坦说过:“提出一个问题往往比解决一个问题更重要。”面对行业专家,若提不出有效问题,他也很难帮到你。以前我们觉得学好数理化走遍天下,可工作后会发现,文科好的人往往发展更好,因为他们表达、交流和共情能力更强。在AI时代,这些能力愈发关键,只要能准确描述问题或诉求,AI就能快速给出答案。所以建议大家学习AI提示语(网络上有很多教程),不但可以提升和AI交流的能力,也能提升在工作中的表达能力。

  AI时代,我们如何自处?

通过自己最近学习AI知识的过程,发现AI相关的基础知识非常繁杂,自己设计模型不现实。唯有从应用角度入手,才能有所收获。此处分享一些心得和理解,仅供参考。

AI的火爆既带来机遇,也潜藏危险,它能帮我们解决工作问题、节省时间成本,但也会消灭很多附加值不高的工作岗位,如简单的文字工作和图像处理。目前,我们普通人无法与AI比拼知识的广度和数量,但可以在某些具体的领域比拼思考的深度。如果我们仍然还停留在对知识进行死记硬背的阶段,那么距离被AI替代就不远了。然而,如果你能够深入的思考所学习过的每个知识点,并将其融会贯通,那么,至少在短时间内你的岗位还是安全的。

在可见的未来,会用AI的人大概率活得更轻松、收获更多,对于“白领”更是如此。善于使用AI工具的人会产出数倍于传统方式的成果。AI是人类能力的放大器,能力基数较高的人通过AI工具的使用会全面碾压能力基数低的人。

每个人都要思考的一个问题是:如何使用AI并与它共存。普通人得清楚自己在AI时代的价值、发展方向。当下我们所能做的,就是学习AI使用方法,让它为我们服务,并找准自己的定位,同时提升自己的思考能力与系统思维。

侯哥工作感悟:侯哥 @Roy 专注汽车电子电气架构开发

删改编:娜可不敢

点赞
收藏
评论
分享
加入交流群
举报

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

既搞过通信,也做过零部件,正在做整车;既做过开发,也搞过测试,参与过生产;经历过民企、合资,也去过外资、国企;既醉心于工程技术,也研究人文历史;丰富的经历,跨界的经验,造就了不一样的思考角度。