测试人员必看:大模型不是万能药,这些场景千万别用AI
文章探讨测试领域如何正确应用AI大模型强调不应盲目追求全能替代而应关注长期工程价值。指出MCP、Agent、Skills是不同层级抽象不适合Agent处理强业务耦合、频繁变更的核心用例完整脚本生成不值得投入真正有价值的是将AI用于用例结构化生成、自动化骨架生成等稳定重复环节。测试使用AI的三条原则判断模糊的不自动化改动频繁的不Agent化只用AI干稳定、重复、机械的活。前排提示文末有大模型AGI-CSDN独家资料包哦1️⃣ 引言测试为什么要警惕 AI 概念热在测试圈谈 AI最常见的落地路径通常是用大模型生成一批测试用例用 Agent 自动跑一套“智能测试流程”尝试让 AI 直接生成可运行的自动化脚本刚开始看效果确实快。但跑一两个迭代后问题会集中爆发用例质量波动大评审成本反而上升自动化脚本不可维护改一次需求基本全废AI 输出越来越“自由”测试不敢直接用这些问题并不是模型不行而是测试把 AI 当成了“全能替代者”。对测试来说判断标准其实非常简单这个东西能不能在 3 个迭代后还稳定帮我省时间如果答案是否定的那再高级的概念都没有工程价值。2️⃣ 背景与现状分析MCP、Agent、Skills 到底在解决什么在工程视角下这几个概念并不是互相竞争的关系而是同一套工程化思路下不同层级的抽象。先把结论说清楚MCP解决 模型能看什么、不能看什么Skills解决 模型能力如何被复用Agent解决 模型如何按流程做事测试的问题不在于“能不能用”而在于这个层级是否适合当前测试场景工程成本是否可控维护责任是否清晰如果这些问题不想清楚AI 一定会在后续迭代中反噬测试团队。3️⃣ 核心实践一哪些测试场景不值得用 Agent先给一个明确结论强业务耦合、频繁变更的核心用例不适合 Agent。典型场景包括复杂促销、价格叠加逻辑多角色、多状态联动历史逻辑与新规则长期混合规则本身不稳定每个迭代都在“微调”为什么 Agent 在这些场景一定会出问题Agent 的前提是流程与规则相对稳定。但在真实业务中一次规则调整Agent 的流程就需要整体重调维护成本迅速超过人工设计测试逐渐失去对核心逻辑的掌控结果往往是Agent 维护成本 人工测试成本核心复杂业务用人主导仍然是更优解。4️⃣ 核心实践二为什么“自动化完整脚本生成”不值得投入很多团队都会尝试让 AI 直接生成“可运行的自动化脚本”。在真实工程里这几乎一定失败原因非常具体断言不可靠语义正确但业务错误数据构造不可复用与现有自动化框架风格严重冲突改动一次需求脚本整体报废维护成本会在 2–3 个迭代内迅速反噬。这类方案的最大问题不是“现在能不能跑”而是半年后还有没有人敢维护。5️⃣ 核心实践三真正值得 Skill 化的测试能力与其追求“全自动”不如把 AI 用在稳定、重复、机械的环节。① 用例「结构化生成」Skill适用前提测试点已由人确认需要大量重复整理用例格式Skill 边界输入测试点、场景说明、约束输出固定字段用例前置 / 步骤 / 预期人机分工人负责“测什么”AI负责“怎么写成标准用例”实际收益大量节省机械性整理时间用例风格统一评审效率明显提升② 自动化「骨架生成」Skill适用前提已有稳定自动化框架脚本结构高度重复Skill 边界只生成请求模板参数结构基础断言占位人机分工AI生成 50%–60% 的脚本骨架人补关键断言、异常逻辑实际收益降低脚本初始编写成本不破坏现有框架一致性③ 回归测试「补充用例」Skill适用前提已有历史用例体系需求为增量修改Skill 边界输入新旧需求差异输出新增 / 受影响用例列表测试价值降低遗漏风险不破坏原有用例结构适合作为回归前的“补充检查”6️⃣ 测试视角下的收益可量化的收益用例整理、补充效率显著提升自动化编写初期成本下降不引入长期维护负担7️⃣ 总结测试使用 AI 的三条硬原则判断模糊的不自动化改动频繁的不 Agent 化只用 AI 干稳定、重复、机械的活测试用 AI不是为了“看起来先进”而是为了在不增加维护成本的前提下稳定省时间。做不到这一点的 AI 能力对测试来说宁可不用。CSDN独家福利最后感谢每一个认真阅读我文章的人礼尚往来总是要有的下面资料虽然不是什么很值钱的东西如果你用得到的话可以直接拿走

相关新闻

【游戏推荐】街漓芳传 (YinYang Street Separate Ways)免安装中文版

【游戏推荐】街漓芳传 (YinYang Street Separate Ways)免安装中文版

类型: 休闲, 冒险, 小游戏 链接:https://pan.quark.cn/s/bffba58ddd0d 游戏简介 《街漓芳传》是一款以上世纪80年代为背景,结合了解谜及文字冒险等玩法的剧情向中式微恐游戏。游戏中应用了可四轴移动的卷轴场景,为玩家带来不一样…

2026/7/3 6:06:34 阅读更多 →
wchar_t与_T()

wchar_t与_T()

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录解决方案(推荐优先方案1)方案1:给指针添加const修饰(最安全,推荐)方案2:强制类型转…

2026/7/3 6:04:43 阅读更多 →
第 1 章:认识 Claude Code

第 1 章:认识 Claude Code

📌 本章学习目标 学完这一章,你将了解: ✅ Claude Code 是什么 ✅ 它能帮你做什么 ✅ 为什么要学习它 ✅ 它和其他工具有什么不同 预计学习时间: 30 分钟 1. Claude Code 是什么? 用最简单的话说 Claude Code …

2026/7/3 6:06:28 阅读更多 →

最新新闻

玩转 Claude Code:如何解决大型遗留代码库重构时的“上下文漂移”与内存爆炸

玩转 Claude Code:如何解决大型遗留代码库重构时的“上下文漂移”与内存爆炸

引言当 Anthropic 发布终端智能体 Claude Code 时,我以为我终于迎来了终极的“虚拟全栈工程师”。作为独立开发者,日常最痛苦的莫过于去动那些陈年的遗留系统。然而,当我第一次尝试让它帮我重构一个历经数次改版、里面充斥着数千个文件、甚至…

2026/7/3 6:05:39 阅读更多 →
如何快速解决Windows热键冲突:3步终极检测指南

如何快速解决Windows热键冲突:3步终极检测指南

如何快速解决Windows热键冲突:3步终极检测指南 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 你是否遇到过精心…

2026/7/3 6:05:39 阅读更多 →
MLFlow简要实现:15分钟搭建可复现实验追踪体系

MLFlow简要实现:15分钟搭建可复现实验追踪体系

1. 项目概述:为什么一个“简要实现”值得花一整篇干货来写? “MLFlow”这个词,现在几乎成了机器学习工程化落地的代名词。但现实很骨感——我见过太多团队,把MLFlow当成一个“部署完就能自动解决所有问题”的黑盒子,结…

2026/7/3 6:03:33 阅读更多 →
Linux 系统编程 09:线程基础

Linux 系统编程 09:线程基础

前言:承接上一篇 System V IPC 三大进程间通信机制,多进程模型实现了任务并发,但进程间切换开销大、通信成本高,在高频并发场景下并非最优解。本篇引入更轻量的并发执行单元 —— 线程,讲解 Linux 线程的底层本质、POS…

2026/7/3 6:01:32 阅读更多 →
深入浅出Linux

深入浅出Linux

Linux 操作系统概述Linux 是一种开源的类 Unix 操作系统内核,由 Linus Torvalds 于 1991 年首次发布。其设计遵循 Unix 哲学,强调模块化、简洁性和高效性。Linux 内核是操作系统的核心组件,负责管理硬件资源、进程调度和系统安全。由于其开源…

2026/7/3 5:59:32 阅读更多 →
Python计算机毕设之基于 Python 的在线图书阅览智能推荐管理系统的设计与实现 基于 Python 的书籍评分溯源智能推荐系统(完整前后端 代码+说明文档+LW,调试定制等)

Python计算机毕设之基于 Python 的在线图书阅览智能推荐管理系统的设计与实现 基于 Python 的书籍评分溯源智能推荐系统(完整前后端 代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/7/3 5:57:31 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻