看完了gihub这篇 ai-coding-lang-bench 测评挺有意思。Ruby核心贡献者Yusuke Endoh用Claude Code在13种语言里实现了一个简化版Git跑了600次实验数据很扎实。直接说结论Ruby、Python、JavaScript注意不是TypeScript是AI编程的最佳语言。平均耗时70-80秒成本0.36-0.39美元稳定性还特别高。静态类型语言普遍慢1.4-2.6倍。这结果其实有点反直觉。很多人认为静态类型能防止AI产生bug理论上应该更高效。但数据告诉我们另一个故事。动态语言的胜利不是偶然。从实验细节看Ruby和Python在v1阶段从零开始写只需要33秒左右而TypeScript要70秒Ruby/Steep带类型检查的Ruby甚至要105秒——差了3倍多。为什么这么悬殊动态语言不需要配置文件。Python、Ruby写个单个脚本就能跑但Go需要Cargo.tomlTypeScript需要tsconfig还得配置构建流程。AI在生成这些配置文件时消耗了大量token和时间。但更重要的是训练数据的偏见。Python、Ruby、JavaScript这些主流语言在训练集中有海量代码Claude对它们的语法、习惯用法烂熟于心。Scheme、Haskell这些小众语言AI脑子里就没那么多现成的模板每次都要重新思考。类型检查的代价有多大Python加上mypy严格类型检查速度慢了1.6-1.7倍。Ruby用Steep更夸张直接慢了2-3.2倍。作者提到一个关键点类型错误其实是最容易发现和修复的bug。如果AI在没有类型检查器的情况下频繁引入类型错误那它大概率也会引入逻辑错误——这时候问题就不是类型检查能解决的了。有趣的是唯三的测试失败出现在Rust2次和Haskell1次——都是静态类型语言。有次Rust的失败日志里AI直接说测试是错的这明显是幻觉。类型检查挡不住所有bug。代码行数不等于效率。OCaml、Haskell的代码量最少216行、224行但生成成本却不低。作者推测是这些语言需要更多的思考token——AI在写代码前花更长时间思考怎么写。反观C语言517行代码生成最慢最贵。手动内存管理、指针操作这些对AI来说都是认知负担。2倍的差距算不算大有人可能觉得多等几十秒无所谓。但作者的观点很对迭代开发中响应速度就是生产力。想想你日常写代码的流程提示→等待→思考下一步→再提示。如果每次提示都要等100秒而不是50秒心流早被打断了。这不是总时间的问题是体验的问题。多花时间写稳健的代码这话没错但竞争对手以2倍速度在迭代时你还能淡定吗开发速度本身也是一种质量维度。但这不代表静态类型没用。作者很诚实承认这个测试任务太小了。大型项目中静态类型的价值可能才会真正体现。设计一个公平的大规模基准测试挺难的但这确实是个需要探索的方向。而且运行时性能和生态系统才是语言选择的硬道理。如果你的应用对性能要求高或者某个语言的生态恰好能帮你省下大量开发时间那生成速度快慢反而次要了。我的思考AI时代语言选择的逻辑在变。传统选语言看什么性能、生态、团队技能。现在AI参与进来后要多考虑一个维度AI在这个语言上的生成效率。这不是说静态类型要被淘汰。恰恰相反混合策略可能更合理先用动态语言快速迭代等项目稳定后用AI辅助迁移到静态类型语言。作者提到AI在跨语言迁移上表现不错这让这个策略越来越现实。但更深层的启示是我们正在进入一个可编程生产力的时代。不是选一个最好的语言而是根据场景、阶段、团队动态选择最合适的工具。Ruby核心贡献者的这个测试给了我们一个量化的起点而不是终点。最后说个有意思的细节作者作为Ruby核心贡献者特别声明我可能有偏见。但数据摆在面前Ruby确实赢了。有时候偏见的对立面是真理。