Claude Code砍80%提示词:AI降本从拆Prompt债
Anthropic 前两天做了一件反直觉的事——删掉了 Claude Code 80% 的 system prompt。从 65K tokens 砍到 13K 左右表现反而更好。你可能也注意到了AI 编程工具跑了一年多各家 agent 的 system prompt 从几百行膨胀到几千行。但 Anthropic 这次不是往里加东西而是直接删。本文从实操角度拆解Anthropic 为什么敢删、怎么删的、以及你能从中借鉴什么。一、背景为什么 65K 的 Prompt 反而成了累赘Claude Code 的 system prompt 原来有 65K tokens——相当于一份 4-5 万字的工程手册。问题在于这套 prompt 是为上一代模型写的。当 Fable 5 上线后情况变了。据 Anthropic 研究员 Tariq Shihipar 在 WF2026 上的分享Fable 5 比其自身的示例更有想象力。过多的示例反而成了限制。一组数据很说明问题OpenAI 的 GPT-5.5 medium 用 2 万 token 就能完成的任务Anthropic 的 Opus 4.8 需要 5 万 token。这不是 Opus 不行是它的 prompt 里塞了太多「保险条款」。反过来如果你的 agent 每个请求都烧掉 5 万 token一个月跑下来算力开支就是薪资的 2.3 倍——这是 Anthropic 内部统计过的数字。所以结论是新模型不需要那么多约束。你的 prompt 不是在帮它而是在拖后腿。二、实操拆解Anthropic 到底删了什么分三层来说每层你都可以在自己的项目里照做。第一层删除过时的规则针对旧模型的「不要做 X」「先分解再执行」等约束在新模型上反而是噪音。Anthropic 删掉这些规则后代码准确率反而提升了——模型不需要在回答之前先查一遍 65K 的规则库来决定输出格式。操作建议打开你的 system prompt找到所有以「不要」「请先」「注意」开头的句子。逐条问自己「如果删掉这条模型会犯错吗」如果不会删掉。第二层合并冗余示例bash 命令的输出格式原来有六七种不同用法每种配一个完整样例。砍完后只保留一种模板剩下的让模型自行推断。操作建议把同类示例合并到 1-2 个去掉重复的变体。模型的泛化能力比你想象中强得多——你不需要给它看所有排列组合。第三层移除「保险条款」那些「如果遇到 X 情况请执行 Y」的条件分支Prompt 越长就越多推理路径越长token 消耗越大。而且大多数条件分支在真实任务中根本碰不到。操作建议运行一次 prompt 审计统计你的 prompt 里有多少条件分支。删掉那些在实际测试中从未被触发的分支。最终效果Claude Code 的 system prompt 从 65K 砍到 13K 左右。作为对比有个叫 Pi 的 agent 工具启动上下文不到 1K tokens——不是砍了 80%是压根没长起来。Pi 的哲学是让模型用自己的能力而不是用 prompt 替代模型。三、实操再进一步Caveman 插件——输出侧的优化删 prompt 是输入侧的优化。输出侧有个叫Caveman的插件专为 Claude Code 设计也支持 Codex。它的核心功能是减少 65-75% 的输出 token但不伤代码、文件路径、函数名这些精确内容。安装方式# 通过 Claude Code 插件系统安装claude pluginsinstallcaveman# 或手动克隆gitclone https://github.com/caveman-ai/claude-code-plugincdclaude-code-pluginmakeinstall核心原理去掉寒暄、模糊措辞和过渡语# 正常输出~80 tokens 现在我来分析一下这个函数……首先需要理解它的参数…… 接着我会检查它的返回类型……最后再来看它的异常处理…… # Caveman 模式~30 tokens 分析函数 check_auth。参数userId str。返回bool。 异常ValueError if token expired。信息量几乎一样但 token 少了一半以上。OpenAI 的工程总监也贡献了代码到这个项目。效果对比# 开启 Caveman 前后对比100次请求统计# 关闭平均输出 485 tokens/次# 开启平均输出 158 tokens/次# 节省67.4%Caveman 的做法和 Anthropic 删 prompt 是同一个方向对抗「AI 写废话」问题。模型输出被调教成了「完整句子 过渡语 礼貌表达」的风格剪掉这些就是纯利润。四、进阶思考压缩 reasoning token 才是真正的大头输入侧砍 prompt输出侧砍寒暄还有一个更大的坑内部 reasoning token。模型在生成答案之前会内部推演十几步每一步都在消耗 token。更关键的是前一步的思考结果会变成后一步的输入——这就像叠罗汉前一层的 token 被链式放大。# 完整英语推理~200 tokens/步 我还需要分析这个函数的边界条件。首先检查输入参数是否为空 然后验证返回类型是否匹配。接下来要考虑异常情况…… # 压缩推理~50 tokens/步 params: {x, y} → 边界条件检查 → 返回类型验证 → 异常处理有分析指出OpenAI 模型在内部推理时已经用了压缩过的工程速记。所以真正的方向是不仅砍 system prompt还要让模型自己学会用更少的 token 思考和输出。Caveman 和 Anthropic 的 prompt 瘦身都只是第一步。五、给你的实操清单5 步 Prompt 降本指南你可能在想这件事和我怎么落地以下是你可以今天就开始做的 5 个步骤步骤 1做一次 prompt 审计把你的 system prompt 拆出三部分类别说明去留判断基础规则任务定义、输出格式保留精简到最少示例few-shot 样例每类保留 1 个删掉变体保险条款条件分支、边界提醒逐个测试未触发即删除判断标准如果删掉这部分模型还能不能完成 90% 的任务能就删。步骤 2按比例压缩基础规则~100 tokens→ 业务逻辑模板~200 tokens → 动态指令~50 tokensvia context 注入 总长 350 tokens和 65K 差了两个数量级步骤 3安装输出优化工具如果你在用 Claude Code 或 Codex装一个 Caveman 试试。减少 65-75% 的输出 token一天跑几百个请求一个月下来省的就是可观数字。步骤 4监控 token 消耗设置一个简单的监控脚本统计每日 prompt 输入和输出 token 量对比优化前后的变化。token 就是成本量化才能管理。步骤 5定期重新评估每季度或每次模型版本升级后重新做一次 prompt 审计。新模型可能不再需要你写在上一代的规则。任何一条「因为上次遇到过所以加上的 prompt 规则」都应该设定过期时间。总结真正的 AI 工程优化不是一个 prompt 写得越来越厚而是模型越来越强我们写得越来越薄。Anthropic 的案例证明砍掉 80% 的 prompt 不仅没有降智反而提升了表现。这不是个例而是一个可以复用到你自己的项目中的方法论。打开你的 prompt 文件找到那些出于「保险」心态写下的陈年规则逐条问自己如果删掉这部分模型还能不能完成 90% 的任务如果答案是「能」就删掉。记住AI 降本的核心思路不是换更便宜的模型而是让现有模型用更少的 token 产出同样甚至更好的结果。从今天开始做一个 prompt 断舍离——砍掉冗余留下精华。参考来源WF2026 Tariq Shihipar 演讲 / InfoQ 深度分析 / Caveman 项目 / Deep SWE 评测对比

相关新闻

1.6.4打破一切MITE

1.6.4打破一切MITE

1.6.4MITE太好玩了

2026/7/6 6:30:55 阅读更多 →
如何通过线上线下结合的旅行社模式,提升竞争力?张源知

如何通过线上线下结合的旅行社模式,提升竞争力?张源知

线上线下结合的旅行社模式日益受到关注、尤其是在消费者对旅行体验要求越来越高的背景下。利用这一模式、旅行社能够同时利用线上平台的便利和线下服务等亲切感,这样更好地满足客户的需求。随着技术不断进步,数字化工具提供了更智能的运营方式&#xff0…

2026/7/6 6:28:55 阅读更多 →
ICM-42688-P与STM32F405ZG在运动感知系统中的应用

ICM-42688-P与STM32F405ZG在运动感知系统中的应用

1. ICM-42688-P与STM32F405ZG的黄金组合解析在工业自动化和机器人控制领域,精确的运动感知能力往往决定着整个系统的性能上限。ICM-42688-P作为TDK InvenSense推出的6轴MEMS惯性测量单元(IMU),与STMicroelectronics的STM32F405ZG微控制器形成的技术组合&…

2026/7/6 6:28:55 阅读更多 →

最新新闻

OpenCV实战:从零搭建实时人脸识别系统,附完整代码与避坑指南

OpenCV实战:从零搭建实时人脸识别系统,附完整代码与避坑指南

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 最近在做一个智能门禁的小项目,需要用到实时人脸识别。本以为用现成的API就能搞定,结果发现对本地化部署、成本…

2026/7/6 7:21:08 阅读更多 →
明日方舟智能助手实战指南:5个核心技巧告别手动肝日常

明日方舟智能助手实战指南:5个核心技巧告别手动肝日常

明日方舟智能助手实战指南:5个核心技巧告别手动肝日常 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://git…

2026/7/6 7:21:08 阅读更多 →
XTR116与STM32的4-20mA电流环工业应用设计

XTR116与STM32的4-20mA电流环工业应用设计

1. 4-20mA电流环技术背景与XTR116特性解析工业现场最头疼的问题莫过于长距离信号传输时的干扰和衰减。我在化工厂做自动化改造时,曾遇到过传感器信号传输300米后完全失真的情况。这时候4-20mA电流环的优势就凸显出来了——电流信号对线路电阻不敏感,抗干…

2026/7/6 7:21:08 阅读更多 →
PgBouncer 的 Transaction 模式详解

PgBouncer 的 Transaction 模式详解

1. 什么是 PgBouncer?PgBouncer 是一个轻量级的 PostgreSQL 连接池工具,用于管理和复用数据库连接,从而减少频繁建立和断开连接的开销,提升数据库性能和可扩展性。2. PgBouncer 的三种连接池模式PgBouncer 支持三种主要的连接池模…

2026/7/6 7:19:07 阅读更多 →
STM32与171010550实现高效DC-DC降压转换器设计

STM32与171010550实现高效DC-DC降压转换器设计

1. 项目背景与硬件选型解析 在电力电子领域,DC-DC降压转换器(Buck Converter)是最基础也是应用最广泛的拓扑结构之一。这个项目选择了171010550电源管理IC与STM32F373VC微控制器的组合方案,这种搭配在工业电源设计中颇具代表性。 …

2026/7/6 7:19:07 阅读更多 →
现代简约客餐厅一体,小户型显大方案

现代简约客餐厅一体,小户型显大方案

现代简约客餐厅一体,小户型显大方案 近年来,随着城市居住空间日益紧凑,郑州本地越来越多的中产家庭在装修时倾向于选择“客餐厅一体化”布局,尤其在80-120㎡的小户型中,通过现代简约风格实现视觉扩容、功能融合与动线优…

2026/7/6 7:17:07 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性:5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域,单元测试是保证代码质量的重要环节。当应用涉及数据库操作时,测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南:告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/6 6:52:56 阅读更多 →

月新闻