本文聚焦AI智能体领域的最新进展涵盖了Claude Sonnet 4.6、千问3.5等模型的突破性能力探讨了AI智能体的核心争议与关键知识点并介绍了Mozilla对AI智能体的定义及其在互联网中的角色。文章还深入解析了AI智能体的体系架构、应用场景及评估范式以及西湖大学AutoFigure科研专属Agent的落地应用。内容旨在为程序员和小白提供一份全面且实用的AI智能体学习资源助力其在AI智能体领域快速成长。*【本期聚焦】**Anthropic 与千问 3.5 驱动 Agent 能力跃迁**告别认知摩擦AI Agent 核心争议与关键知识点汇总**Mozilla 定义 AI 智能体为互联网第八层协议*开源生态直指开发者体验LLM 代理六大组件成型记忆 工具 规划 编排构筑完整闭环西湖大学 AutoFigure 落地科研专属 Agent多智能体框架实现发表级插图全自动生成。*本期内容聚焦2月8日至2月21日AI Agent 领域全栈进展覆盖**模型能力、架构范式、开源生态与行业应用*呈现 AI Agent 从单点演示向安全可控、可复用、可规模化落地的系统工程演进。一、Claude Sonnet 4.6重磅发布在AI Agent领域有何突破内容提要1.核心升级聚焦智能体能力明确AI Agent发展方向。Anthropic 于大年初二发布其现阶段能力最强的 Sonnet 模型——Claude Sonnet 4.6官方明确将“智能体规划”列为核心升级方向之一同步对与AI Agent运行密切相关的编码、计算机使用、长上下文推理等能力进行全面优化且该模型Beta版配备100万token的上下文窗口为复杂智能体任务提供支撑。2.计算机使用能力迭代逼近人类操作水平。作为AI Agent自主执行任务的核心能力Claude Sonnet 4.6的计算机使用能力得到显著提升。该模型可在OSWorld基准测试的模拟环境中通过虚拟鼠标点击、键盘输入的方式操作Chrome、LibreOffice、VS Code等真实软件完成数百项各类任务过去十六个月内其在该基准上的性能稳步提升早期用户反馈显示模型在浏览复杂电子表格、填写多步骤网页表单等任务中已接近人类水平还能跨多个浏览器标签页整合处理信息仅在操作熟练度上略逊于最熟练人类。3.强化安全防护降低AI Agent被劫持风险。针对AI Agent在计算机使用过程中可能面临的提示注入攻击风险恶意行为者将指令隐藏在网站中劫持模型Anthropic重点优化了Claude Sonnet 4.6的安全性能。安全评估结果显示与前代模型Sonnet 4.5相比该模型在抵抗提示注入、防止被非法劫持方面有重大改进安全表现已接近Anthropic高阶模型Opus 4.6为AI Agent安全自主运行提供保障。4.长程规划能力突出展现智能体策略性思维。**依托100万token的超大上下文窗口Claude Sonnet 4.6可高效处理海量信息并进行全局推理大幅提升了AI Agent的长程规划与多步骤任务执行能力。**在Vending-Bench Arena模拟经营评测中评估模型长期运营业务、与其他AI模型竞争获取最大利润的能力该模型展现出清晰的策略性思维通过“前期大力投资产能、后期聚焦盈利能力”的动态调整策略最终大幅领先于竞争对手Sonnet 4.5。5.优化指令遵循与逻辑表现适配自动化Agent场景。Claude Sonnet 4.6在指令遵循、逻辑整合、减少幻觉等方面进行了针对性优化。早期测试显示70%的用户更偏好该模型而非Sonnet 4.559%的用户甚至更倾向于选择它而非高阶的Opus 4.5用户反馈其在修改代码时能更好理解上下文、整合共享逻辑减少过度工程化和“偷懒”行为虚假成功声明与幻觉更少在多步骤智能体任务中执行力更稳定。【茶思小词典】智能体规划Agent Planning结合Claude Sonnet 4.6的能力特性智能体规划Agent Planning是该模型核心升级方向之一指模型具备的长程推理、多步骤任务统筹及动态策略调整能力可依托超大上下文窗口整合海量信息在复杂场景如模拟经营中制定合理方案并根据实际情况优化调整同时配合自主计算机操作、指令遵循等能力保障智能体相关任务高效、稳定落地。二、千问3.5登顶全球开源榜首在AI Agent领域有何亮眼表现内容提要1.模型重磅开源为AI Agent能力落地奠定基础。除夕夜阿里开源全新一代模型千问3.5Qwen3.5-Plus该模型性能媲美Gemini 3 Pro、GPT-5.2等顶级闭源模型登顶全球最强开源大模型。**其采用阿里自研门控技术曾获NeurIPS最佳论文仅用397B总参数激活参数17B就超越万亿参数的Qwen3-Max解码吞吐量暴增19倍同时上下文提升至1M每百万Token输入仅0.8元不到GPT 5.2的1/15、Gemini 3 Pro的1/18高性价比与强性能为AI Agent的低成本、高效率部署提供了有力支撑。**目前该模型可在千问APP免费体验阿里云百炼也已上线其API服务便于开发者基于其搭建AI Agent相关应用。2.原生多模态能力强化AI Agent感知与理解维度。千问3.5是国内少有的支持视觉理解的原生多模态模型其在视觉和文本Token的混合数据上进行预训练让模型具备“视觉感知”能力能够掌握更密集的世界知识和推理逻辑。这种原生多模态优势的落地让AI Agent可实现图生代码、图片解说、视频摘要提取等跨模态任务例如能理解图片原理并设计《流浪地球3》主题行星发动机演示网页拆解径向分布式聚变推进系统运行原理模拟能量产生、流转的完整过程大幅拓展了AI Agent的应用场景。3.强大编码能力支撑AI Agent自主开发与网页复刻。千问3.5的编码能力突出可高效完成各类AI Agent相关的开发任务其表现跻身全球顶尖模型行列与Gemini 3 Pro、Claude Opus 4.6等模型相当。实测中该模型能成功创建功能完备的3D魔方模拟网页实现魔方自动解谜可按照严格设计规范将枯燥文本转化为高端杂志风格的可视化网页贴合科技产品宣传需求更能参考现有Agent产品界面复刻出名为“Woyin Agent”的Web应用布局、色彩、UI组件还原度高可直接作为AI Agent产品的基础原型使用。4.自主任务执行实现AI Agent自动化工作流闭环。千问3.5具备明确的AI Agent自主操作能力可自主完成任务统筹与执行尤其在内容创作领域实现了工作流全自动化。该模型能自主操作电脑整理素材帮助用户省去写稿前的资料搜集环节指令遵循得分达76.5可精准理解用户需求拒绝“人工智障”式响应同时支持201种语言能一键生成跨境文案提升小语种编码效率60%其MMLU-Pro得分87.8逻辑推理能力强劲可独立完成深度分析类文稿甚至能协助用户拟定文章标题形成“需求-执行-输出”的AI Agent自动化闭环。5.关联成熟Agent产品展现AI Agent生态潜力。千问3.5的Agent能力可与阿里现有生态产品联动文中提及阿里海外已有成熟的MuleRun Agent产品该产品支持“一句话搓Agent”生成的Agent可分享、可盈利而千问3.5能精准复刻此类Agent产品的网页界面说明其具备适配现有Agent生态、快速落地Agent应用的能力。此外千问3.5在推理、视觉理解、编码等AI Agent核心能力上全面对标顶级模型且部署成本比上一代旗舰模型直降60%、推理速度飙升8倍为AI Agent的规模化应用和生态拓展提供了可能。【茶思小词典】Agent网页复刻能力特指阿里开源模型千问3.5Qwen3.5-Plus所具备的、支撑AI Agent产品落地的核心实操能力也是其AI Agent能力的重要体现。具体指模型可参考现有Agent产品的界面无需复杂指令仅通过图片参考就能精准复刻出对应Agent Web应用的布局、色彩、UI组件等核心元素形成可直接使用的Agent产品基础原型文中实测中该模型成功复刻出“Woyin Agent”Web应用还原度高且该能力与模型强劲的编码、视觉理解能力深度结合媲美全球顶级模型的同类Agent开发适配能力。三、告别认知摩擦AI Agent 核心争议与关键知识点汇总内容提要1.AI Agent 的定义与核心特质。AI Agent 是在普通代理基础上具备任务理解、环境感知、信息获取、推理决策及自主执行能力的智能系统由 LLM大语言模型与具备规划、工具使用、记忆功能的客户端如Chatbot、AI IDE等组成核心是代替用户自主完成下达的各类任务区别于普通代理的核心的是其自主智能性。2.AI Agent 与传统软件、传统自动化软件的核心差异。传统软件依赖用户明确指令和预设规则需用户深度参与传统自动化软件仅能按规则完成固定流程任务无法应对复杂、模糊场景。而 AI Agent 依托 LLM 的感知与推理能力可通过调用外部知识库、联网搜索、交互各类工具等方式自主完成复杂任务核心优势是“自动化智能”能处理决策、连续推理、跨系统整合数据等传统自动化难以应对的场景。3.Chatbot 向 AI Agent 演进的核心驱动因素。早期 Chatbot 仅为概率驱动的文本生成器缺乏自主决策和行动能力向 AI Agent 演进是技术与市场需求共同作用的结果。技术上LLM 推理能力提升、多工具协作成熟、长期记忆与自主性能力发展、规划推理模块完善为演进提供支撑市场上用户对效率和自动化要求提升、商业模式扩展需求、行业竞争加剧推动 Chatbot 从“能说会道”向“真知实干”转型。4.AI Agent 的核心组件与不同定义差异。AI Agent 的构成暂无统一标准Anthropic 认为其核心组件包括模型大脑、环境反馈执行任务所需信息总和、工具与外部交互的“手脚”并区分了 Workflow 与 AgentOpenAI 则将其定义为模型、工具和指令弱化环境反馈并将其下沉到模型层两者核心差异在于外部调用及效果优化的实现层不同模型层 vs 编排层。5.AI Agent 的工作原理与输出效果提升方法。AI Agent 的工作原理分为感知、认知推理决策、行动、反馈与学习四个关键阶段感知阶段获取任务及环境信息认知推理阶段分析决策行动阶段执行输出反馈学习阶段优化策略。提升其输出效果的关键在于模型质量和环境反馈可通过选择适配任务的模型、合理选用工具如MCP、Function Call、优化指令利用现有文档、分解任务等实现。【茶思小词典】自博弈Self-Play一种训练方法让智能体在与自身或其他智能体的迭代对抗中学习策略通过不断挑战和适应对手的进化策略来提升自身能力。在多智能体系统中自博弈能有效激发模型的角色意识和意图识别等推理能力并使其泛化到通用任务场景。四、AI 智能体系统体系架构、应用场景及评估范式内容提要1.综述核心定位与研究维度。本文是一篇关于AI智能体AI Agents的综合性综述明确AI智能体是结合基座模型与推理、规划、记忆及工具调用能力的系统核心作用是作为自然语言意图与现实世界计算之间的实用接口。综述重点围绕三个核心维度展开研究一是审议与推理含思维链式分解、自我反思验证等二是规划与控制从反应式策略到层级化多步规划器三是工具调用与环境交互含检索、代码执行、API接口及多模态感知构建了统一的分类体系整合前序相关研究。2.AI 智能体的核心构成与编排、部署模式。综述明确了AI智能体的核心组件包括策略/大语言模型核心、记忆、世界模型、规划器、工具路由及批判器六大模块。在编排模式上将其分为单智能体与多智能体两大类其中多智能体又包含中心化与去中心化两种协作模式在部署场景上涵盖离线分析与在线交互辅助、安全敏感型与开放式任务等多种场景全面梳理了AI智能体的系统架构全景。3.AI 智能体的发展动机与背景。基座模型的发展已使自然语言成为计算的实用接口但多数现实任务并非单轮问答需多来源信息搜集、跨时间执行状态维护、多工具选择及约束条件下的多步动作执行AI智能体通过将基座模型与执行循环耦合填补了这一空白成为将意图转化为现实世界可执行程序的控制器。其发展背景源于现代数字化工作的碎片化特征纯对话系统因幻觉、缺乏接地性等问题表现不佳而工具增强与检索增强设计及模块化工具路由为AI智能体的可靠性、治理能力提供了支撑。4.AI 智能体的重要性与关键技术支撑。当前AI智能体的重要性主要体现在三方面一是任务范畴从写作辅助扩展至工作流自动化覆盖代码、Web、企业助手等多场景二是部署模式呈现交互性与长程性特征推动验证循环与追踪式评估发展三是安全与防护压力凸显需建立深度防御的对齐机制与护栏。其发展得益于多项关键技术包括基座模型的泛化与指令遵循能力、对齐与偏好优化、工具调用与检索记忆技术、推理与行动编排模式及多模态感知技术。5.AI 智能体的当前局限与未来研究重点。目前AI智能体在规模化应用中仍存在局限主要包括可靠性、可重复性和治理能力不足长程任务易放大复合错误非确定性增加评估调试难度同时面临提示词注入、不可信检索内容等安全风险系统层面的多维度权衡尚未被深入理解。综述明确了未来研究重点包括测量与基准测试实践的完善以及工具行为验证与护栏机制、可扩展记忆与上下文管理、决策可解释性、真实工作负载下可重复评估等亟待解决的挑战。【茶思小词典】智能体编排模式结合AI智能体综述及提要内容智能体编排模式是AI智能体系统架构的核心组成部分指对AI智能体进行组织、协作与调度的方式是综述中统一分类体系的重要维度。其主要分为单智能体与多智能体两大类其中多智能体模式进一步包含中心化与去中心化两种协作形式适配离线分析、在线交互辅助等不同部署场景与智能体核心组件、工具调用能力相配合支撑多步复杂任务的高效完成。五、MozillaAI 智能体正在成为第 8 层互联网协议内容提要1.AI时代的使命拷问Mozilla的破局初心。Mozilla曾是开源、安全与反商业化的代名词其Firefox浏览器凭借坚守用户立场的理念积累了大批忠实用户。但在AI时代当各大厂商纷纷以封闭模型、封闭数据构建生态、重新定义行业规则时坚守浏览器阵地的Mozilla逐渐显得不合时宜。面对这场决定未来十年数字世界格局的变革Mozilla必须明确自身定位在AI成为新“用户代理”的趋势下一个以“用户代理”为核心使命的组织应如何坚守初心、发挥作用新任CTO发布的开源AI战略博客正是对这一问题的正式回应。2.AI作为互联网“第八层”重构“用户代理”格局。Mozilla提出核心判断人工智能正成为互联网协议栈的“第八层”即智能体代理层这一层将介于用户与各类互联网服务之间代表用户完成浏览、信息过滤、内容推荐等操作重塑了过去由浏览器承担的“用户代理”角色。浏览器的本质是代表用户立场而Mozilla的精神内核便是站在用户一边、保护用户隐私、对抗不合理网络规则正如其当年凭借Firefox打破IE浏览器垄断、开启Web 2.0时代一样如今面对AI这个新“用户代理”Mozilla直指行业核心矛盾——智能的所有权与租赁权之争立志再次扮演破局者为用户提供“成为主人”的选择打破大型科技公司的封闭生态垄断。3.开源AI的核心痛点聚焦开发者体验突围。Mozilla明确当前开源AI无法与封闭系统抗衡的根本原因并非价值观差异而是开发者体验不佳。封闭AI系统之所以占据优势核心在于其易用性——开发者仅需一次API调用几分钟内就能搭建可用原型GPU、模型托管、安全护栏等所有环节均被打包成服务而开源AI生态虽充满活力、发展迅速却极度碎片化模型、工具、评估、编排等组件分散在多个独立项目中接口不统一开发者需具备大量专业知识、花费大量时间才能将这些组件组装成生产级系统。Mozilla借鉴PC、Web早期开放系统最终超越封闭平台的历史规律计划通过解决开发者体验问题让开源AI成为“更优交易”。4.开源AI四大突破口构建全链路开放技术栈。为打破闭源模型的规则垄断Mozilla制定了四大核心突破方向目标是构建类似当年LAMP的全链路开放技术栈。**一是优化开发者体验打造any-suite模块化框架**整合分散的开源组件让开源AI的入门体验等同于调用单个API**二是布局数据领域通过“Mozilla数据集体”项目建立数据市场**提供高质量授权训练数据保障数据贡献者的话语权与经济收益解决AI训练的数据合规痛点**三是推动模型生态多样化支持小型模型、专家混合模型等新兴架构**打破大型实验室对大模型的垄断**四是破解算力瓶颈通过分布式计算、联邦方法、闲置GPU利用等方式**扩大算力共享范围降低开源AI的部署门槛。5.理想与现实的差距Mozilla的信任赤字与前路挑战。尽管Mozilla的开源AI战略规划清晰、初心可嘉但社区对其认可度不高核心源于长期积累的“信任赤字”。多年来Mozilla在开发者和老用户眼中已从“屠龙勇士”变成行为迷惑、不务正业的组织——对核心产品Firefox投入不足过多资源被投入到各类失败的“副业”中同时其绝大部分收入依赖谷歌的搜索合作协议这种对竞争对手的依赖让其“开放网络捍卫者”的立场显得十分尴尬。当前Mozilla既要背负历史包袱、重建社区信任也要在巨头环伺、赢家通吃的AI格局中推动开源AI生态落地前路注定艰难但它仍立志复刻当年开放网络的成功构建比闭源替代品更优的开源AI解决方案。【茶思小词典】Mozilla开源AI战略结合选中提要及原文内容Mozilla开源AI战略是Mozilla在AI时代为坚守“用户代理”核心使命、打破大型科技公司封闭AI生态垄断而制定的行动规划由新任CTO正式发布核心是解决开源AI开发者体验不佳的痛点通过开发者体验优化、数据合规布局、模型生态多样化、算力瓶颈破解四大突破口构建全链路开放技术栈让用户成为AI智能的“主人”而非“租客”同时需应对社区信任赤字、核心产品投入不足等现实挑战。六、图解 AI 智能体LLM 如何拥有“记忆”与“手脚”内容提要1.LLM代理的核心定义与本质增强型LLM的智能升级。LLM代理并非传统对话式LLM的替代而是基于“增强型大型语言模型”发展而来的智能系统其本质是通过整合外部组件弥补LLM固有缺陷如无记忆、不擅长数理计算等。根据Russell和Norvig在《人工智能现代方法》中的定义代理是能通过传感器感知环境、通过执行器作用于环境的存在LLM代理则在此基础上优化适配文本场景具备“理解情境LLM-规划步骤规划能力-执行行动工具-跟踪过程记忆”的完整闭环且可根据系统设计具备不同程度的自主性自主性越强“代理化”特征越明显。原文强调LLM代理的实现离不开多个组件协同而非单一LLM的能力延伸。2.记忆组件破解LLM遗忘难题支撑多步骤任务推进。记忆是LLM代理的核心基础核心作用是解决传统LLM“无记忆”的痛点分为短期记忆与长期记忆两类二者协同保障代理的连续交互能力。短期记忆依托LLM的上下文窗口实现通过将对话历史纳入上下文跟踪近期行动与交互内容当上下文窗口不足或对话过长时可通过另一个LLM总结对话核心压缩代币数量并保留关键信息。长期记忆则用于存储长时间跨度的代理动作、交互记录等常用实现方式是借助外部向量数据库通过将对话、动作嵌入为数值表示结合检索增强生成RAG技术快速匹配并调用相关历史信息同时可结合心理学中的记忆分类将语义记忆世界事实与工作记忆当前情境等分开存储优化框架合理性支持跨会话记忆留存如记住过往研究内容。3.工具组件链接外部环境拓展LLM代理能力边界。工具是LLM代理与外部世界交互的关键载体核心用途分为两类获取最新数据信息、执行具体操作如安排会议、运行代码。**LLM使用工具的核心是生成符合工具API规范的文本多为JSON格式也可直接调用代码或自定义函数即函数调用目前多数LLM可通过精准提示实现工具调用更稳定的方式则是通过微调优化工具适配能力。**工具使用技术的发展经历了从Toolformer标记化工具调用、人工生成训练数据集到ToolLLM支持数千种工具、Gorilla快速检索相关工具的迭代为解决多API工具调用繁琐需手动跟踪、描述、更新的问题Anthropic推出模型上下文协议MCP通过MCP主机、客户端、服务器的协同标准化API访问让工具可快速适配各类LLM应用降低工具集成门槛。4.规划组件实现智能决策支撑自主任务拆解与优化。规划是LLM代理自主决策的核心核心功能是将复杂任务拆解为可执行步骤同时迭代反思过往行为、调整当前计划解决“何时使用何种工具”的关键问题。规划的基础是LLM的推理能力可通过两种方式实现提示工程如思维链通过示例或“一步步思考”引导结构化推理分为少样本提示与零样本提示、模型微调如DeepSeek-R1通过奖励机制引导推理行为。在此基础上ReAct技术实现了推理与行动的结合通过“思考-动作-观察”的循环的提示引导让LLM代理在推理后执行工具操作、观察结果并持续调整针对ReAct缺乏失败反思的缺陷Reflexion通过执行者、评估者、自我反思三个角色结合记忆模块跟踪错误、优化行为、自我精炼单一LLM迭代生成输出、反馈与精炼结果等技术进一步完善了规划能力让代理可从失败中学习。5.多智能体协作突破单一代理局限实现专业化协同。单一LLM代理存在工具选择复杂、上下文承载有限、难以应对专业化任务等问题多智能体框架则通过多个专用代理的协同解决上述痛点。多智能体系统的核心是“专业化分工协同调度”通常由多个具备独立工具、记忆、规划能力的专用代理组成搭配主管角色负责代理间通信与任务分配其核心组件包括代理初始化如何创建专用代理与代理编排如何协调多个代理。典型案例如《生成智能体人类行为的交互模拟》中的生成智能体每个代理配备记忆、规划、反思模块通过记忆检索按近期性、重要性、相关性评分实现自主交互以行为可信度为核心评估指标常用模块化框架包括AutoGen、MetaGPT、CAMEL等其中CAMEL通过“AI用户AI助手”的角色扮演促进协作各框架虽通信方式不同但均以代理间的协同交互为核心且近年来发展迅猛2025年有望实现进一步成熟。七、西湖大学的发表级科研论文插图制作AI Agent来了内容提要1.成果归属与发表平台。AutoFigure 是西湖大学团队的研究成果相关研究论文已被2026年国际学习表征会议ICLR 2026 接收该成果聚焦于文本生成科学插图的技术研究为科研可视化领域提供了全新的解决方案。2.构建首个专属大规模基准数据集。团队打造了**FigureBench这是首个面向文本到科学插图生成任务的大规模基准测试集包含 3300 对高质量的文本 - 插图样本**填补了该领域缺乏标准化评测数据集的空白为相关模型的训练与评估提供了重要支撑。3.创新多阶段智能体协作框架。AutoFigure 采用多智能体协作的 agentic 框架完成科学插图生成通过四个核心阶段层层推进从科学文本中提取关键实体、关系与结构根据内容类型规划最优视觉排版验证内容的完整性与逻辑一致性最终生成可直接用于发表的科学插图实现了从文本到专业插图的端到端生成。4.设计多维度科学评价方案。基于 FigureBench 数据集团队设计了以****“VLM-as-a-judge”****范式为基础的专属评价方案结合参考评分与盲法成对比较的方式从美学质量、内容准确性等多个核心维度对 AI 生成的科学插图进行全面、客观的评估保证了评测结果的科学性。5.模型性能领先且开放交互式演示。在 FigureBench 上的大量对比实验表明AutoFigure 的性能显著优于所有基线方法能够稳定生成符合学术发表标准的高质量科学插图同时团队开放了 AutoFigure 的交互式演示项目可通过 GitHub 仓库及在线演示地址体验该模型的文本生成科学插图功能演示版本虽采用启发式提取方法仍能直观展现核心技术逻辑。如何系统的学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】01.大模型风口已至月薪30K的AI岗正在批量诞生2025年大模型应用呈现爆发式增长根据工信部最新数据国内大模型相关岗位缺口达47万初级工程师平均薪资28K数据来源BOSS直聘报告70%企业存在能用模型不会调优的痛点真实案例某二本机械专业学员通过4个月系统学习成功拿到某AI医疗公司大模型优化岗offer薪资直接翻3倍02.大模型 AI 学习和面试资料1️⃣ 提示词工程把ChatGPT从玩具变成生产工具2️⃣ RAG系统让大模型精准输出行业知识3️⃣ 智能体开发用AutoGPT打造24小时数字员工熬了三个大夜整理的《AI进化工具包》送你✔️ 大厂内部LLM落地手册含58个真实案例✔️ 提示词设计模板库覆盖12大应用场景✔️ 私藏学习路径图0基础到项目实战仅需90天第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】