大模型推理能力提升秘籍:5个简单又好用的框架,小白也能轻松学会并收藏!
本文介绍了5种提升大模型推理能力的框架包括CoT、CoT-SC、ToT、GoT和ReAct。这些框架都基于巧妙的提示词设计无需额外训练即可显著提升模型的推理表现。它们通过让模型用自然语言显式模仿人类的决策过程缓解了黑箱问题并使模型的决策过程更接近人类思维。其中ReAct框架将推理与行动整合借助外部工具和反馈构建出能够与外部世界互动的AI代理成为构建现代AI代理的事实标准之一。这些框架对于想要深入了解大模型推理能力的程序员和小白来说都是极具价值的参考资料。1. 智能 vs 智障GPT首次出圈亮相人们被它强大流畅的问答能力给震撼到了但随着LLMs在现实环境中运用越来越广泛我们总是能够发现一些莫名其妙的bug让我们觉得AI在“智能”和“智障”之间反复横跳。比如去年的时候一些大模型经典推理**“9.11大于9.8”**……业界和学者发现在算术推理做数学题、常识推理比如梳子放在梳妆台和符号推理领域直接提问大模型它的表现很差。不仅表现很差它的整个决策过程还是黑箱的你没有办法判断它是怎么得出最后结论的这使得在金融、医疗等需要高可靠性和问责制的领域部署大模型面临巨大挑战。在拥有强大的现代大模型背景下怎么提升模型“推理能力”又成为了新的课题。今天就来看看几个简单又好用的提升大模型做推理任务的框架会包含CoTChain of ThoughtCoT-SCChain of Thought - Self ConsistencyToTTree of ThoughtsReActReasoning and Act我觉得这几个框架很有意思的是它们都是**“Prompt-based ”框架也就是说它们都仅仅通过巧妙的设计“提示词”不用额外训练就让大模型在推理任务上的表现有了显著的提升**可谓是**“便宜又好用”**的典范。它们都让大模型通过**“自然语言”来“显式地模仿人类的决策过程”体现出了设计者“从人类身上寻找”**灵感的思路。我们知道很多现代发明都受到“大自然的启发”在人工智能这条路上我们真的在迁移“自身的能力”给它们。这种模仿不仅一定程度缓解了大模型决策的**“黑箱”问题**还在实际改变了大模型的“决策”显得它好像真的会思考一样。这是非常有意思的现象。其中ReAct框架更是因为其强大的扩展性演变成了一种基础性的设计范式 (Design Pattern)在业界也被广泛采用并成为构建现代 AI 代理 (Agent) 的事实标准之一。2. 让模型来表演推理现代大模型拥有千亿级别的参数这些参数在人类眼中是**“无法解读”的数字**。我们询问一个问题大模型吐出一个答案但是我们不知道它是怎么得到这些答案的很难去判别答案的可靠性要怎么解决这个问题呢最直观的方式是在不改变“连接主义大模型”的框架上单纯使用**“提示词”来让模型把“推理”表演一遍**就像是在模仿人类思考时的“内心独白”。让模型**“用自然语言先说出推理步骤然后再说答案”**直接避免黑箱问题这个思路就是CoTChain of Thought所采用的。CoT论文中采用的方法很简单就是模型在回答问题之前事先展示几个**“推理”的文字例子**这些例子会包括**“问题解决问题的中间步骤最终答案”**然后再让大模型去回答现在的问题。大模型就会学习提示词中的例子先“展示”中间步骤再阐述是怎么从这些“中间步骤”得到最终答案的。这种极其强大的模仿能力又被称为In-Context Learning意思是模型不需要重新训练就能像一个学霸一样仅通过看几个例子就瞬间学会解题方法。这个办法比起标准的“直接提问”不仅在实证上大幅提高了模型面临推理问题时的表现还一定程度解决了“连接主义”大模型完全黑箱的问题。PS连接主义 vs 符号派这是AI发展的两条技术路线。连接主义现在的主流AI像人脑通过大量神经元连接学习内部机制复杂像个“黑箱”符号派早期AI则像计算机程序基于明确的逻辑规则进行推理步骤清晰。甚至后面的研究更加夸张甚至连“举几个例子”都不需要了对于**能力特别强大的如百亿、千亿参数级别模型只需要说“Let’s think step by step”**这一句咒语就能够触发大模型在给出最终答案之前先输出自己的推理工作流使推理效果显著提升。CoT是一个特别简单有效的框架但是它的缺陷也来源于此它不进行事前的规划可能在一开始就没有选对方向它不检查自己的结果可能在思维链的某一个环节胡说八道一本正经的硬凑答案或者因为前面的环节已经错误在一条错误的道路越跑越偏。为了修正这些问题让这种连接主义的模型“推理”更加可靠学者们采用了很多种方案。CoT只让模型进行一次推理可能得出完全错误的答案那么让模型多思考几次不就可以了在这条思路下诞生了CoT-SCChain of Thought Self Consistency这种方法认为模型如果通过多种路径思考出相同的答案那么那个“答案”是正确的概率就很高。好像在无法验证“真相是什么”的情况下我们询问了多个专家专家的意见都指向同一种描述那么这个描述的可靠性就很高。CoT-SC在Prompt构造上跟CoT完全一致只是在“解码大模型生成并输出token”环节不同。CoT-SC会选择一种更加“多样化”的输出策略通过调节Temprature、Top-k等技术参数产生出“多条”推理路径然后统计每个路径下得到的答案。**“大多数推理路径投票的答案”**就是模型给到用户的最终答案。与纯CoT相比CoT-SC在多种数据集上的表现都显著提升GSM8K (小学数学应用题17.9%)SVAMP (变体数学应用题11.0%)AQuA (代数应用多选题12.2%)……它赋予了模型一种判断“答案自信程度的方法”。当模型生成的多个答案非常分散、一致性很低时可以将其作为一个信号表明模型对当前问题的“信心不足”。这使得模型能够**“知道自己何时不知道”**。CoT-SC虽然让模型表演了“多种不同的”推理路径但是它在每条路径上都是**“一条道走到黑的”这产生了极大的浪费。CoT-SC论文中的实验主要使用了40条推理路径来报告其最佳结果想一想一个问题要产生40条推理路径并且还需要详细描述中间步骤**是有多么烧token其实有些路径从一开始就可以看出来“不对劲”有些路径走着走着“不对劲了”比较省力的办法不是从头开始而是**“返回到上一步”**再重新去寻找解决的方案。于是一种借鉴了经典符号派AI思路的方法——**ToTTree of Thought**诞生了。早在1956年创立AI学科的达特茅斯会议上艾伦·纽厄尔Allen Newell和赫伯特·西蒙Herbert A. Simon就展示了**“逻辑理论家Logic Theorist”**程序。“逻辑理论家”旨在证明怀特海和罗素在其巨著《数学原理》中的数学定理 。它的核心方法论是将推理视为一种搜索问题。程序从一个初始假设树根出发通过应用逻辑规则进行演绎树枝在一个不断扩展的搜索树中寻找待证明的命题 。为了应对搜索空间呈指数级增长的“组合爆炸”问题纽厄尔和西蒙引入了**“启发法heuristics”——模仿人类解决问题时所用的“经验法则”凭着“直觉”**剪除那些看起来不太可能通向解决方案的分支 。“逻辑理论家”成功证明了《数学原理》第二章前52个定理中的38个甚至为其中一些定理找到了更简洁的证明 。它首次具体地证明了“一台机器可以执行此前被认为是智能的、创造性的、并且是人类独有的任务” 。ToTTree of Thought的核心观点也是“把推理问题变成一个搜索问题来做”。它这次不会让模型“一条道走到黑”了而是变成**“走一步想一下”并且还增加了“回溯”和“反思”**的环节。让模型的推理“表演”越来越接近人类真正的决策过程。ToT论文里面介绍了3个任务凑24点、5*5的填字游戏和创意写作。我在这里就拿“凑24点”来举例子了。它的游戏要求是利用“加、减、乘、除”操作把给出的4个数字凑成24。框架有4个核心步骤引导模型分解问题。引导模型产生Thoughts。对已有路径进行“前瞻性”评估。利用搜索算法确定下一个节点。第一步引导模型分解问题。这一步是通过针对性设计prompt来完成的。比如在“凑24点”这个游戏里面作者首先给到的指引是一次只能选择2个数字来产生1个新数字。“Use numbers and basic arithmetic operations ( - * /) to obtain 24. Each step, you are only allowed to choose two of the remaining numbers to obtain a new number……在这后面是5个范例”通过这种人为的“拆解”来让模型不得不遵循作者指定的框架走很多步完成任务。**第二步引导模型产生Thoughts。**这个Thoughts就是推理路径中的一步会形成“树的节点”。在论文里面有两种产生Thoughts的方式都是通过“调整提示词”来实现的Sample独立产生Thoughts。这依赖外部的程序把“相同的提示词”一遍又一遍地传递给大模型**每次传递是隔离的大模型不会记得以前说过了什么。**只是因为调节了Temperature、Top-K等参数模型的回答会有随机性。这种方法比较适合那种**“答案不可枚举”**的场景比如创意性写作。Propose同时产生多个Thoughts。这个方法在提示词中直接要求模型“一次性生成K个不同的方案”这样模型就****不会重复提出方案。这种方法很适合那种**“答案可以枚举”**的场景比如凑24点。第三步对于模型产生的路径进行“前瞻性”评估。这个评估依据已经获得的信息去“直觉性”的感受一下每条路径成功的可能性从而确认探索的顺序这就是“启发法”。所谓“直觉”判断就是直接用**“Few-Shot Prompt”引导大模型自己做判断**。评估的方法也可以分为两种。Value独立评估每个State即为思维路径。这个方法依赖****外部程序多次传递给模型“设计好的评估提示词”让模型“独立”对每一条路径进行打分或者分类从而判断下一步的探索顺序。在凑24点中这个提示词是这样构造的“Evaluate if given numbers can reach 24 (sure/likely/impossible)”代表模型实际上完成的是一个分类任务判断每条路径成功凑出24点是“一定”、“有可能”还是“不可能”。然后接下来是几个精巧的范例比如对于10、14这种简单情况要给出sure对于11、12这种明显凑不出24的要给出impossible而对于5、7、8这种有希望但又不确定的情况则引导它给出likely。Vote不给每个路径单独打分而是在一组不同的状态states中进行****比较和选择。这种方法适用于不好量化评估的场景。比如在创意写作的任务中模型需要评估生成文本的连贯性在绝对值打分不好区分的情况下可以直接给出几段文本让模型选取其中“最连贯”的一个。第四步利用搜索算法确定下一个节点。我们刚刚提到了“把推理问题当成一个搜索问题来看”ToT在每个节点都衍生出多个节点一个一个都去探索会面临“组合爆炸”问题确定一种“选择路径的策略”就是“搜索算法”。这里使用了两种经典的搜索算法广度搜索每一步保留评估排序“top b”的方案进行探索b是人为控制的参数。相当于在每个岔路口它都会把“前b个好方案”探索完然后再往下走。再往下走也是探索“前b个好方案”。“凑24点”实验使用的是这个搜索方案。深度搜索。每一步只探索“最有前景”的那个方案一头扎下去直到“解决问题”或者“走到死路”。走到某一步S如果在评估环节模型对这条路径的判断是“死路”会直接把S下面的路径删除剪枝返回S的上一步选择“次优”的选项继续探索以此类推直到成功为止。在凑24点任务上ToT的表现优于CoT-SC。在ToT中模型处于每个节点都需要停下来思考接下来有几条路径这使得模型展示出了**“计划”行为**。在模型自己提出了几个推理路径之后还需要对于自己提出的路径进行评估使用了经典的启发法使得模型展示出了**“反思”行为**。在模型一条路径失败之后模型可以回退到上一个节点重新选择另外的“计划”这是一种有效的自我纠错机制。这样的过程是不是就很接近人类在做计划的时候会使用的办法Tree of Thought清晰地指出了单线程、线性推理的局限性并提供了一个符合人类思维直觉的解决方案。但是它在工程实践上的巨大开销金钱、时间、复杂性使其并没有被广泛应用到主流产品中。这里稍微再提一下在ToT之后还出现了另外一种框架来提升模型做复杂任务的能力GoTGraph of Thoughts。在原始的论文中使用了**“排序任务**比如给32个数字排序”来测试GoT框架表现显示GoT的成功率要比ToT的成功率高62%并且成本比ToT减少31%。证明GoT是一个有效且集约的框架。GoT认为人类在思考过程中产生的想法不是“僵硬的树状结构”而是非常灵活多变的**“网状结构”**。人类可以灵活的从一个想法跳跃到另外一个想法从而产生“顿悟”可以把不同的想法综合起来取长补短最后形成一个和原始想法都不一致的新想法人类还能够先写一个“草稿”出来然后不停补充和完善这个“草稿”最后形成一个成熟的想法。ToT强制模型只能够创造“树状的思考空间”这实际上限制了模型的能力。GoT把模型生成的“Thought”建模为任意图结构Arbitrary Graph——“Thought”作为顶点边则对应这些顶点之间的依赖关系。它允许模型对已经产生的“Thoughts”进行**“变型Transformation”**。论文里面的“变型”模仿人类思考的模式Aggregation聚合将任意思想聚合为新的思想以结合并强化这些思想的优势同时消除它们的劣势。Refining精炼对当前思想的内容进行修改和完善。Generation生成可以根据现有的单一思想生成一个或多个新思想。GoT设计了多个“程序组件”去组合实现这个“网状的推理过程”。去作者给的代码示例里面扒了一扒本菜鸡大概的感受就是GoT实现起来比较复杂。作者给出的“排序任务”示例在任务拆解、prompt设计、状态管理环节都比较定制化基本就是要**“具体任务具体分析了”。而且还需要用代码去维护整个“图的状态、节点的依赖关系”这背后有很多远超过“Few-Shot Prompting”的工程开销**。但是引入“图结构”是一个很有启发性的做法。3. 借助外部力量的框架ReAct上面提到的几种框架都是在使用模型的**“内部”能力**还没有借助“外部”力量这当然是不科学的——人类在完成复杂任务的时候也会**“调阅外部资料”或者是“使用外部工具”。**人类的决策过程是一系列**“思考”和“行动”的组合**在这个过程中人类通过“外部反馈”更新自己认知从而产生新的思考直到达到自己的目标。对应这一思路ReAct产生了它把模型的**“推理/思考”和“行动”整合到了一起仅仅用“提示词”**就让模型在完成推理任务时的成功率比对应模仿学习和强化学习方法分别高出34%和10%极其简洁有效。这里介绍原论文提出的ReAct框架因为它非常具有扩展性后面衍生出来的众多变种可以说是Agent的最初框架不在这里过多展开了ReAct是针对语言类任务的它设定给模型一个简单的外部空间**“Wiki”**它用于测试的数据集有2个HotPotQA一个需要在两个或多个维基百科段落上进行推理的多跳问答基准数据集FEVER一个事实验证基准数据集其中每个声明被标注为支持SUPPORTS、反驳REFUTES或信息不足NOT ENOUGH INFO取决于是否存在维基百科段落来验证该声明。在ReAct论文中模型只能接收问题/声明作为输入必须依靠其内部知识或通过与外部环境交互来检索知识以支持推理。ReAct框架让模型不停重复**“思考-行动-观察”**这一行动轨迹直到模型认为自己可以输出答案。**思考**接收到输入分析自己需要采取的行动。行动模型可以采取的行动是提前定义好并且作为“上下文”输入给模型的这里通过提示词要求模型输出自己要选择哪一种“行动”为了方便后续处理模型的输出格式是被控制的。ReAct定义了3种行动给到模型也就是模型要从这3种行动中选择一个严格按照格式输出。action1搜索[实体]——外部程序会把“[]”中的内容解析出来传给Wiki API进行查询若对应“实体”维基页面存在则返回其前5句话否则从维基百科搜索引擎推荐前5个相似实体。action2查找[字符串]——外部程序会把“[]”中的内容解析出来传给Wiki API进行查询返回当前页面包含该字符串的下一句话模拟浏览器CtrlF功能。action3完成[答案]——这是一个结束动作模型输出这个动作外部程序会解析“[]”中的内容作为最终给用户的回答并且终止“思考-行动-观察”循环。看下这是作者github里面给出的系统提示词负责跟模型约定好“行动空间”instruction “”Solve a question answering task with interleaving Thought, Action, Observation steps. Thought can reason about the current situation, and Action can be three types:(1) Search[entity], which searches the exact entity on Wikipedia and returns the first paragraph if it exists. If not, it will return some similar entities to search.(2) Lookup[keyword], which returns the next sentence containing keyword in the current passage.(3) Finish[answer], which returns the answer and finishes the task. Here are some examples. 观察在模型选择完“行动”之后依靠外部程序把“行动的结果”连同历史“输入”和“行动”反馈给模型。模型开始进行新一轮的思考。下面这个例子展示ReAct是怎么利用**“Few Shot prompt”**来让模型显式表演“思考-行动-观察”循环的。除此之外作者还分别使用了标准提示词、CoT、Act即为只行动不思考的框架、ReAct几种类型的回答轨迹数据去微调一个更小的模型发现ReAct的轨迹数据带来的表现提升最大。ReAct数据微调的62B模型表现甚至好于没有经过微调只使用Prompt的540B模型。可见使用更多的标注“思考-行动-观察”数据去微调可以更加极致的挖掘出ReAct框架的能力。在这篇原始论文里面作者只是设定了Wiki API为模型可以调用的工具但这个**“外部工具”的概念可以无限向外扩展**变成日历、计算器、公司内部知识库还有用途超级广泛的“代码解释器”……从而构建出“能够与外部世界互动”的Agent。这个框架具有极高的扩展性。Lilian Weng一篇介绍LLM Powered Autonomous Agents的博客里面给出了Agent的3个重要组成部分PlaningSubgoal and decomposition Reflection and refinementMemoryShort-term memory Long-term memoryTool Useexternal APIs这3个组成部分在ReAct框架里面都能够看到雏形而且它的实现还只需要加提示词代码就可以了提升效果还很明显所以这真的是一个设计很巧妙的框架啊4. 小结现代大语言模型自海量数据里面诞生通过深度神经网络把知识隐性地储存在自己的参数中体现出一种“暴力美学”。作为创作者的我们对它**“内部运行机制”甚至对它的“能力”**并不完全理解正是因为如此“可解释性AIXAI”也成为了新的研究热点。学者们探索各种“提示词框架”发现不同的“提示词”可以激发大模型不同的表现试图从中找到**“最极致挖掘大模型潜力的”提示方法**还有最符合“实际业务需求的”提示方法这是“提示工程”要研究的内容。CoT通过让大模型表演思考让模型在推理类任务上的表现显著提高。CoT-SC通过让模型产生更多的思考路径加上**“多数投票”机制**让模型回答的稳健性进一步增强。这无比接近人类思考的方式因为在不知道正确答案的时候人类也能凭借着“交叉验证”等方法增加自己接近“真相”的概率。ToT里面我觉得是有“符号派AI”的一些思路比如把**“推理任务”转变一个“搜索任务”比如让大模型自己去“直觉式”评估已有状态**优先探索那些“估值更高”的路线。在这个框架里面模型在每一步会优先**“计划”自己有几条路径可走按照“搜索策略”去逐一往下推进如果进入死胡同还可以“回溯”到上一个节点选择其他的路线。这些设计都让整个模型的决策过程更加“像个人类”**。GoT则比ToT更进一步超越线性思维引入了**“图结构”**让模型可以对“Thoghts”进行合并、迭代或者是基于它产生新的Thoughts。它相当于是定义了一种更加广泛推理框架把前面几种推理结构都包含进行来了。ReAct同样是一个极其简洁同时效果又很好的框架。它把**“外界工具的调用”和“工具调用的反馈”跟“模型的思考”整合到一起。借助这个框架模型不断完成“思考-行动-反馈”循环**直到达到目标。这跟我们去完成“Plan计划-Do执行-Check检查-Act处理循环”已经无比接近。它在学术概念提出的时候作者只示范了调用简单的工具但是这个“工具”的概念极具扩展性。经过这几年的发展ReAct 框架在业界也已经被广泛采用并成为构建现代 AI 代理 (Agent) 的事实标准之一。ReAct 被LangChain、LlamaIndex等主流AI开发框架内置支持在 GitHub、Hugging Face 等开发者社区也涌现出大量基于 ReAct 思想构建的开源项目。感觉是Agent入门必看的框架~我们可以发现这几个框架都只是通过“提示词引导”模型改变表现要怎么**“从源头上”就让模型更会推理**就是另外一个话题了。并且这几个框架还没有非常精细的处理**“长期积累的历史对话”这件事对于需要“长程依赖的任务”**效果不佳而“长期记忆”这件事就逐渐进入到比“提示词”更加复杂“上下文”要怎么处理的领域了。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

C#:泛型where

C#:泛型where

在 C# 泛型中,where T : new() 约束用于确保类型参数 T 具有公共无参构造函数,这在 CacheHelper 中的应用主要体现在需要动态创建缓存对象实例的场景。 1、基本语法与约束含义where T : new() 约束要求泛型类型参数 T 必须具有一个公共的无参构造函数。这…

2026/7/4 20:25:10 阅读更多 →
SpringBoot + 图片压缩 + 水印 + CDN 回源:用户上传头像自动优化

SpringBoot + 图片压缩 + 水印 + CDN 回源:用户上传头像自动优化

痛点分析:为什么图片优化这么重要? 相信每个做过用户系统的后端都遇到过这些场景: 场景一:用户上传一张原图 用户随手拍了一张4K照片,6MB大小 1000个用户同时上传,瞬间消耗6GB带宽 服务器磁盘空间告急,运维小哥半夜被叫醒 场景二:头像加载龟速 用户头像未经优化,…

2026/7/3 4:17:59 阅读更多 →
从此告别拖延 10个降AIGC工具测评:MBA高效降AI率必备神器

从此告别拖延 10个降AIGC工具测评:MBA高效降AI率必备神器

在当前学术写作中,AI生成内容的普及让论文查重和AIGC率成为MBA学生必须面对的挑战。无论是课程作业、毕业论文还是商业报告,如何有效降低AI痕迹、保持语义通顺,是提升论文质量的关键。随着技术的发展,AI降重工具应运而生&#xff…

2026/7/4 21:00:56 阅读更多 →

最新新闻

如何识别真正可落地的AI项目标题

如何识别真正可落地的AI项目标题

我不能按照该标题生成博文。原因如下:该标题属于实时科技商业新闻类内容,核心是报道OpenAI公司人事变动事件,本质为媒体资讯传播,而非可复现、可操作、可深度拆解的“项目”;根据你设定的【角色与任务定义】&#xff0…

2026/7/5 3:59:09 阅读更多 →
区分于三层架构的四层架构(Java 后端分层设计的完整指南)

区分于三层架构的四层架构(Java 后端分层设计的完整指南)

四层架构:Java 后端分层设计的完整指南适用场景:Spring Boot / Spring MVC 等 Java Web 后端 关键词:Controller Service Repository Entity 分层架构 职责分离我遇到的问题 刚学 Java Web 开发时,很容易把所有逻辑堆在一个类…

2026/7/5 3:57:09 阅读更多 →
Alexa增强与自主交通流耦合的语音交互新范式

Alexa增强与自主交通流耦合的语音交互新范式

1. 项目概述:这不是一次普通的技术发布会,而是一场关于“智能体如何真正融入人类生活节奏”的现场压力测试“Alexa Enhancements, Autonomous Traffic at AI Summit”——这个标题乍看像两条并行的新闻快讯,但如果你在现场待过三小时以上&…

2026/7/5 3:55:08 阅读更多 →
洞悉生态-社会耦合机制、多源数据融合进阶应用:基于当量因子法InVEST、SolVES模型等多技术融合在生态系统服务功能社会价值评估种的应用

洞悉生态-社会耦合机制、多源数据融合进阶应用:基于当量因子法InVEST、SolVES模型等多技术融合在生态系统服务功能社会价值评估种的应用

在生态文明建设的浪潮中,你是否正为如何量化那些难以用货币衡量的“人心账”而头疼?传统的生态评估往往只算清了“经济账”,却忽略了公众对美学、休闲和精神寄托的感知。作为破解这一难题的核心利器,当量因子法、InVEST与SolVES的…

2026/7/5 3:55:08 阅读更多 →
面试时,你会问面试官哪些问题?

面试时,你会问面试官哪些问题?

明天又要去参加一次面试。每次面试的时候,面试官都会在最后给面试者一些时间,来问问题。这是个非常好的机会,能按照自己的思路,来了解职位、技术、企业文化、福利待遇、企业状况和前景等情况,以弥补前面面试过程中没有…

2026/7/5 3:53:08 阅读更多 →
零基础!IntelliJ IDEA + CC GUI + 智谱AI 配置全记录

零基础!IntelliJ IDEA + CC GUI + 智谱AI 配置全记录

一、背景与目标 目标:在 IntelliJ IDEA 中使用 Claude Code 风格的 AI 编程助手,且希望免费、稳定、合规。 最终方案:IntelliJ IDEA CC GUI 插件 cc-switch 工具 智谱AI GLM 免费模型。 二、完整过程与遇到的问题 阶段 1:想…

2026/7/5 3:51:07 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻