全球公司集体反省:从“Token管够”到“小模型经济学”,省钱风潮来袭!
全球公司转向“小模型经济学”曾经Token管够的公司如今集体开始节约。最近美国Agent公司Lindy将100%的托管Agent流量从Claude迁移至DeepSeek V4理由是能节省数百万美元推理成本迁移流量成本下降约90%。不仅如此一些美国开发者和中小公司转向中国模型因其在大量日常任务上“够用且便宜”。据外媒报道Siemens、Renault、Orange、ChapsVision等欧洲企业也开始混用美国、中国、欧洲的模型。Token最大化的反噬过去一年很多企业鼓励员工多用AI认为Token烧得越多越能证明公司“AI - first”。但随着Token账单摆在面前全球公司开始集体反省“该省省该花花”小模型经济学风潮兴起。所谓小模型经济学就是不什么活都请最贵的专家。过去企业接入AI默认用最强模型然而前沿模型是Token碎钞机成本高昂。于是大家思考是否每件事都要用最贵的旗舰模型结果发现简单活分给便宜模型复杂活上贵模型效果不错这一省钱“小妙招”被称为“小模型经济学”。这一经济学并非凭空产生而是被账单逼出来的。Uber曾鼓励工程师多用AI编程工具如Claude Code、Cursor但仅几个月就烧穿全年AI编程预算。Uber COO Andrew Macdonald公开质疑Claude Code使用量与“多交付25%有用消费者功能”的关联随后公司给员工设Token限额每人、每个工具每月1500美元Token花费超额需获批。亚马逊员工自发做KiroRank排行榜比谁用Token多有人钻漏洞高级副总裁Dave Treadwell只好喊话“别为了用AI而用AI”排行榜下线。Meta内部的“Claudeonomics”也遭遇同样问题。目前大公司都开始收紧Token用量微软取消Claude Code直接许可转向GitHub Copilot CLICopilot从固定订阅走向按量计费Meta从“Token最大化”转向“Token最小化”策略计划限制员工Token使用因内部AI使用成本预计达数十亿美元级别。小模型经济学变成一门生意企业抠预算的同时供给侧也发生变化便宜模型开始好用。DeepSeek V4系列是典型代表其价格比Anthropic模型低约20 - 50倍在Ramp的企业软件采购趋势榜上曾冲到第一在Vercel AI Gateway的生产流量中Token份额一个月从不到1%升至17%连微软都考虑用其微调版顶替Copilot Cowork里的Anthropic、OpenAI。行业形成分层逻辑不差钱或任务难时用OpenAI、Anthropic的旗舰模型算性价比则用DeepSeek、Kimi、智谱GLM、MiniMax等“够用且便宜”的模型。开源项目ClawRouter数据显示这种分层组合可将平均成本从每百万Token 25美元压到约2美元。在这种逻辑下OpenRouter等模型路由公司变得有价值。OpenRouter不训练模型而是做模型调度台考虑价格、延迟、稳定性、上下文长度等因素帮助企业和开发者在数百个模型之间调度。据外媒报道OpenRouter今年完成1.13亿美元B轮融资估值约13亿美元周处理Token量涨了5倍到25万亿拥有800万用户。Vercel数据显示大规模AI应用不是一个模型打天下月请求量超1000万次的团队平均会同时使用35个模型AI使用像分工明确的流水线。还有LiteLLM、Helicone等工具把模型路由做成财务系统可按团队、项目、模型设置预算监控Token消耗切换流量。云厂商也跟进AWS Bedrock的Intelligent Prompt Routing能在同一模型家族里自动分配请求内部测试显示可节省48%到56%成本。企业如何落地“小模型经济学”企业落地“小模型经济学”面临具体技术问题如请求该派给便宜模型还是贵模型需把AI任务拆成小步骤。以客服Agent为例用户问“我的订单到哪了”先让便宜模型判断意图再抽出订单号调用物流API最后用中等模型润色结果企业可减少昂贵推理。AI编程也类似读取目录等简单任务可交给便宜模型大型重构等复杂任务交给强模型。企业实现模型路由通常有几种做法。最简单的是规则路由如订单查询走小模型加API法律问题走强模型加人审更常见的是级联路由先让便宜模型回答校验不通过再升级给贵模型还有学习型路由系统根据提示词难度等自动判断用哪个模型。近两年相关工程化手艺成为研究课题如ParetoBandit研究动态环境里的预算路由Budget - Aware Agentic Routing研究Agent场景。当企业转向务实的“小模型经济学”这是继续扩大AI使用的前提。

相关新闻

A 股上市公司高管数字背景数据集

A 股上市公司高管数字背景数据集

📊 数据核心速览数据编号:2374时间跨度:2004–2025 A 股公司年度面板底层数据源:上市公司年报、董监高简历文本理论对标文献:Wang et al. (2025) Asia Pacific Journal of Management(TMT 数字知识断层理论…

2026/7/2 19:52:56 阅读更多 →
深度兴趣网络与时间感知在实时推荐系统中的工程实践

深度兴趣网络与时间感知在实时推荐系统中的工程实践

1. 项目概述:当实时推荐遇上每日梦幻体育 如果你玩过或者听说过每日梦幻体育,比如那种今天选球员、明天看积分排名的游戏,你肯定知道选人有多纠结。阵容名单每天更新,球员状态瞬息万变,昨晚的神射手可能今天就因伤轮休…

2026/7/2 19:48:55 阅读更多 →
VLM情感识别实战:破解长尾数据与时间建模两大瓶颈

VLM情感识别实战:破解长尾数据与时间建模两大瓶颈

1. 从“看”到“懂”的鸿沟:VLM情感识别的核心挑战最近在折腾多模态大模型(VLM)的应用落地,特别是情感识别这个方向,感触颇深。表面上看,让模型“看”一段视频或“听”一段音频,然后说出里面的人…

2026/7/2 19:42:51 阅读更多 →

最新新闻

utpasswd插件开发指南:扩展功能的简易方法

utpasswd插件开发指南:扩展功能的简易方法

utpasswd插件开发指南:扩展功能的简易方法 【免费下载链接】utpasswd utpasswd is a refactoring of passwd. 项目地址: https://gitcode.com/openeuler/utpasswd 前往项目官网免费下载:https://ar.openeuler.org/ar/ utpasswd是openEuler系统中…

2026/7/2 20:59:19 阅读更多 →
QPushButton美化秘籍:Kiran Style按钮样式全解析

QPushButton美化秘籍:Kiran Style按钮样式全解析

QPushButton美化秘籍:Kiran Style按钮样式全解析 【免费下载链接】kiran-widgets-qt5 Kiran Desktop Widgets Library 项目地址: https://gitcode.com/openeuler/kiran-widgets-qt5 前往项目官网免费下载:https://ar.openeuler.org/ar/ 想要让Qt…

2026/7/2 20:57:19 阅读更多 →
为什么选择dpu-utilities:DPU场景下openEuler生态的终极解决方案

为什么选择dpu-utilities:DPU场景下openEuler生态的终极解决方案

为什么选择dpu-utilities:DPU场景下openEuler生态的终极解决方案 【免费下载链接】dpu-utilities dpu-utilities is DPU customized software utility based on openEuler 项目地址: https://gitcode.com/openeuler/dpu-utilities 前往项目官网免费下载&…

2026/7/2 20:55:18 阅读更多 →
终极敏感数据防护框架:openeuler/cdf-crypto如何提升数据安全等级?

终极敏感数据防护框架:openeuler/cdf-crypto如何提升数据安全等级?

终极敏感数据防护框架:openeuler/cdf-crypto如何提升数据安全等级? 【免费下载链接】cdf-crypto A lib that provides a programming framework for high-strength cryptographic algorithms and key security. 项目地址: https://gitcode.com/openeul…

2026/7/2 20:53:17 阅读更多 →
Kiran Authentication Service与UKey集成:硬件令牌认证完整实现

Kiran Authentication Service与UKey集成:硬件令牌认证完整实现

Kiran Authentication Service与UKey集成:硬件令牌认证完整实现 【免费下载链接】kiran-authentication-service Kiran authentication service is used to do system auth with password, fingerprint, face 项目地址: https://gitcode.com/openeuler/kiran-auth…

2026/7/2 20:53:17 阅读更多 →
Kiran Biometrics PAM模块配置教程:实现系统级生物认证

Kiran Biometrics PAM模块配置教程:实现系统级生物认证

Kiran Biometrics PAM模块配置教程:实现系统级生物认证 【免费下载链接】kiran-biometrics Kiran Biometrics is used do fprint and face auth for system. 项目地址: https://gitcode.com/openeuler/kiran-biometrics 前往项目官网免费下载:htt…

2026/7/2 20:49:16 阅读更多 →

日新闻

Path of Building PoE2:5步掌握流放之路2角色构建的终极免费工具

Path of Building PoE2:5步掌握流放之路2角色构建的终极免费工具

Path of Building PoE2:5步掌握流放之路2角色构建的终极免费工具 【免费下载链接】PathOfBuilding-PoE2 项目地址: https://gitcode.com/GitHub_Trending/pa/PathOfBuilding-PoE2 还在为《流放之路2》复杂的角色构建而头疼吗?面对上千个天赋节点…

2026/7/2 19:10:19 阅读更多 →
SSH密钥生成原理与跨平台安全实践指南

SSH密钥生成原理与跨平台安全实践指南

1. 为什么今天还必须亲手生成 SSH 密钥——不是“过时操作”,而是安全基建的起点你可能已经点开过几十次 GitHub 的 SSH 设置页,也见过终端里一闪而过的ssh-keygen -t ed25519 -C "your_emailexample.com"命令,但真正理解它在 macO…

2026/7/2 19:10:19 阅读更多 →
GAN工程化实战:从图像合成到物理建模的工业落地路径

GAN工程化实战:从图像合成到物理建模的工业落地路径

1. 项目概述:当GAN不再只是“画图玩具”,它正在悄悄重构现实世界的生产逻辑“Astonishing GAN Applications”——这个标题乍看像科技展会的宣传语,但在我过去三年深度参与17个GAN落地项目的实操经验里,它根本不是修辞&#xff0c…

2026/7/2 19:12:20 阅读更多 →

周新闻

月新闻