大模型知识梳理(持续更新)
大模型的底层——TrasnsformerTransformer 架构是一种基于自注意力机制Self-Attention的深度学习模型由 Google 团队在 2017 年的论文《Attention Is All You Need》中首次提出。它改变了自然语言处理NLP领域并成为现代大语言模型如GPT、BERT等的核心基础。Transformer 与循环神经网络RNN类似旨在处理自然语言等顺序输入数据适用于机器翻译、文本摘要等任务。然而与 RNN 不同Transformer 无需逐步处理序列而是可以一次性并行处理整个输入。Transformer架构分为两部分其中左边为编码器多头注意力机制ADDNormFFN右边为解码器。编码器让模型对原本语句进行多次上下文理解输出一组向量表示原句间各词融合上下文信息后的数字变现形式为计算机对输入文本的理解。解码器基于编码器输出的理解来进行预测生成每步都进行生成后加入序列再生成。Eembedding编码输入的序列会经过编码包括词编码和位置编码。由于计算机不认识除01以外的寓意所以需要词编码将当前词归类到一个N维向量中通过每个维度的值来让计算机识别当前词的语义这个流程称为词编码。位置 Embedding 表示单词出现在句子中的位置。因为 Transformer 不采用 RNN 的结构而是使用全局信息不能利用单词的顺序信息而这部分信息对于 NLP 来说非常重要。所以 Transformer 中使用位置 Embedding 保存单词在序列中的相对或绝对位置。计算公式如下Multi-Headed Self-Attention多头自注意力红框部分为多头注意力机制作用是让模型同时关注输入中的所有单词并计算它们之间的关系。多头注意力是由多个 Self-Attention组成Multi-Head Attention 上方还包括一个 Add Norm 层Add 表示残差连接 (Residual Connection) 用于防止网络退化Norm 表示 Layer Normalization用于对每一层的激活值进行归一化。Self-Attention自注意力上图是 Self-Attention 的结构在计算的时候需要用到矩阵Q(查询),K(键值),V(值)。在实际中Self-Attention 接收的是输入(单词的表示向量x组成的矩阵X) 或者上一个 Encoder block 的输出。而Q,K,V正是通过 Self-Attention 的输入进行线性变换得到的。得到矩阵 Q, K, V之后就可以计算出 Self-Attention 的输出了计算的公式如下其中Q跟K的点积用来衡量两个词之间的影响程度下方的维度用来避免内积过大外部的Softmax分类器是对矩阵的每一行进行 Softmax让影响之和为1最后乘上V语义内容。只算一次注意力并不够因为这只代表一个维度多头注意力机制对文本的不同维度语义语法等进行处理可以拿到更丰富的词间关系。Norm层归一化作用稳定训练过程防止数值过大或过小类似调音量到合适范围。Feed-Forward Network前馈神经网络作用线性无法获取复杂语义信息FFN通过将线性转变为非线性对每个单词的表示进行进一步加工提取更复杂的特征。Masked Multi-Headed Self-Attention掩码多头自注意力作用训练时防止模型作弊只能看到当前和之前的单词不能看未来的。举例生成我爱__“时模型只能基于我”“爱预测下一个词不能提前知道答案是你”。Multi-Headed Cross-Attention多头交叉注意力作用让解码器询问编码器“关于输入我应该重点关注什么”场景翻译任务中解码器生成英文时会参考编码器处理的中文输入。大模型应用的整体架构用户层 ↓ Prompt层提示工程 ↓ 能力扩展层RAG / Tools / Skills ↓ Agent调度层MCP / Agent Framework ↓ 基础模型层LLMPromptPrompt 是 控制 LLM 行为的核心手段。Prompt 给模型的任务说明书正常的大模型会区分系统System提示词和用User户提示词系统提示词的优先级更高对输出的影响权重更大系统提示词一般为大模型的后门有对应的.md文件Claude.md进行录入用户提示词一般为前端chat有五种常见用法1 Zero-shot 直接提问 例解释Kafka的消费流程 2 Few-shot 给例子 例 Q: 11 A:2 3 Chain-of-Thought 思维链让模型一步步推理 例请一步步分析问题XXXX 4 Role Prompt 角色设定赋予大模型一个角色 例你是一名资深架构师 5 Structured Prompt结构化输出 例请以JSON格式输出 { root_cause:, solution: }RAGRetrieval Augmented GenerationRAG 检索增强生成用来解决大模型不具备公司内部数据上下文的从而至幻的问题。RAG流程 用户问题 ↓ 向量检索Vector DB ↓ 找到相关文档 ↓ 拼接到Prompt ↓ LLM生成回答 流程图 Question ↓ Embedding ↓ Vector DB ↓ TopK Documents ↓ Prompt Context ↓ LLMMCPModel Context ProtocolMCP 是非常重要的一个协议核心作用是让 LLM 标准化调用外部工具。架构 LLM ↓ MCP Client ↓ MCP Server ↓ ToolsSkillsSkills 可以理解为LLM 可以调用的能力函数一个 Skill 本质就是Function / API放入AI客户端skils目录完成安装 ↓ 用户发送需求客户端加载所有skil的metadata发给大模型 ↓ 大模型识别并返回所需skil客户端加载对应文件为系统提示词发送 ↓ 大模型按需让客户端读取参考资料/执行脚本 ↓ 大模型整合结果输出给用户总结把这些概念串起来即完整流程用户问题 ↓ Prompt设计 ↓ Agent理解任务 ↓ 需要知识 → RAG 需要能力 → Skills 需要工具 → MCP ↓ LLM生成答案对比SKILLS/MCP/WORKFLOWSkill vS MCP:mcp可理解为操作工具给大模型配的“手”协议插件是操控外部的工具skills可理解为操作经验规定场景下工具使用顺序工具包括MCP插件本地script脚本Skill vs Workflow:workflow是通过规则配置编排调度的流程低代码工具编排步骤设计阶段确定流程结构skills可理解为由大模型驱动的调度的流程执行流程动态变化灵活性更高

相关新闻

薪酬面议,上不封顶 | 自变量机器人深圳/北京招募6D位姿估计、定位、导航、SLAM算法工程师等岗位

薪酬面议,上不封顶 | 自变量机器人深圳/北京招募6D位姿估计、定位、导航、SLAM算法工程师等岗位

公司介绍自变量机器人成立于2023年12月。公司聚焦自研通用具身智能大模型及人形机器人本体,以软硬一体化的路径,实现通用机器人。自变量自研的「Great Wall」具身智能大模型系列的WALL-A,具备自主感知、推理、长程决策交互,世界模…

2026/7/5 16:18:50 阅读更多 →
SocketTool、串口调试助手、MQTT中间件基础

SocketTool、串口调试助手、MQTT中间件基础

目录 一、SocketTool 二、串口通信 三、MQTT中间件 一、SocketTool 1、TCP 通信测试: 1)创建 TCP Server 2)创建 TCP Client 连接 Socket 4)数据收发 在TCP Server发送数据12345 在 TCP Client 端的 Socket 即可收到数据12…

2026/7/6 1:06:31 阅读更多 →
Flutter 三方库 random_user_agents 的鸿蒙化适配指南 - 掌控 UA 资产、精密 User-Agent 治理实战、鸿蒙级伪装专家

Flutter 三方库 random_user_agents 的鸿蒙化适配指南 - 掌控 UA 资产、精密 User-Agent 治理实战、鸿蒙级伪装专家

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net Flutter 三方库 random_user_agents 的鸿蒙化适配指南 - 掌控 UA 资产、精密 User-Agent 治理实战、鸿蒙级伪装专家 在鸿蒙跨平台应用执行高级请求头管理与多维度 User-Agent 资产指控&…

2026/7/4 23:49:03 阅读更多 →

最新新闻

深入理解Go语言内存模型与优化

深入理解Go语言内存模型与优化

深入理解Go语言内存模型与优化Go语言以其简洁的语法、强大的并发模型和出色的性能,在现代软件开发中占据了重要地位。然而,要真正释放Go程序的潜力,开发者必须深入理解其内存模型,并掌握相关的优化技巧。Go的内存管理虽然由垃圾回…

2026/7/6 1:05:31 阅读更多 →
松下伺服电子齿轮比计算:从脉冲当量到参数设置的 3 个实战案例

松下伺服电子齿轮比计算:从脉冲当量到参数设置的 3 个实战案例

松下伺服电子齿轮比实战指南:从脉冲当量到参数设置的深度解析在工业自动化领域,伺服系统的精度控制一直是工程师们关注的核心问题。作为松下伺服系统的关键参数之一,电子齿轮比的正确设置直接关系到设备的运动精度和响应速度。本文将从一个全…

2026/7/6 1:05:31 阅读更多 →
V4L2 零拷贝与内存分配机制

V4L2 零拷贝与内存分配机制

在 Linux 嵌入式多媒体与 AI 边缘计算(如 RK3588 平台)中,为了实现极低延迟和降低 CPU 占用,通常需要打通摄像头(Camera)、图像格式转换模块(RGA/GPU)、AI 加速器(NPU&am…

2026/7/6 1:01:30 阅读更多 →
KYC形同虚设?揭秘黑产绕过金融机构身份核验全套手法

KYC形同虚设?揭秘黑产绕过金融机构身份核验全套手法

KYC(Know Your Customer,了解你的客户)并非信贷行业的专属课题,而是数字经济时代每一个需要建立"信任关系"的商业场景所共有的核心命题。无论是金融、电商、出行还是短视频,当平台试图确认"站在对面的究…

2026/7/6 1:01:30 阅读更多 →
Agentic Testing实战:自主AI测试代理架构与实现

Agentic Testing实战:自主AI测试代理架构与实现

# Agentic Testing实战:自主AI测试代理架构与实现## 一、背景与挑战:传统测试自动化的天花板当CI/CD流水线每天触发数百次测试执行,当微服务架构的API变更频率以分钟计,传统基于录制回放或关键字驱动的测试框架逐渐暴露出结构性缺…

2026/7/6 1:01:30 阅读更多 →
Windows上的安卓应用安装神器:APK安装器完整指南

Windows上的安卓应用安装神器:APK安装器完整指南

Windows上的安卓应用安装神器:APK安装器完整指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 想在Windows电脑上轻松安装安卓应用吗?APK安装…

2026/7/6 0:59:29 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性:5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域,单元测试是保证代码质量的重要环节。当应用涉及数据库操作时,测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南:告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻