同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比
前面几期测的都是模型官方 API。但你实际用的时候大概率走的不是官方——而是通过某个聚合平台。为什么几个现实原因不想每个模型绑一张信用卡公司采购要求统一结算官方 API 在某些地区不稳定想用一个 API Key 调所有模型所以这期我不测模型了——同一个 DeepSeek V4 Pro走三个主流聚合平台OpenRouter、SiliconFlow、DeepInfra。比价格、延迟、可靠性、文档质量。先说结论OpenRouter 最全面但贵。SiliconFlow 最便宜、中文支持最好。DeepInfra 开源模型最便宜但文档稀烂。测试设计参数值测试时间2026-05-24测试模型DeepSeek V4 Pro同一个模型三个平台都支持任务5 任务框架代码生成、Bug 修复、文档注释、SQL 生成、单元测试每平台调用数25 次5 任务 × 5 轮测可靠性统计指标价格、首 token 延迟、端到端延迟、错误率、文档可用性平台简介平台一句话模型数中国访问OpenRouter最大的模型聚合商支持 300 模型300需翻墙被墙SiliconFlow硅基流动国产平台中文社区活跃150直连国内访问快DeepInfra开源模型为主推理优化好100直连偶尔慢价格对比同一模型DeepSeek V4 Pro三个平台输入/输出价格每百万 token平台输入 $/M输出 $/Mvs 官方额外费用DeepSeek 官方$1.74$3.48—无OpenRouter$2.00$4.0015%无SiliconFlow$1.74$3.48同价无DeepInfra$2.10$4.2021%无SiliconFlow 跟官方同价——这是最有竞争力的。OpenRouter 加价 15%DeepInfra 加价 21%。延迟对比同一个模型同样的 prompt走不同平台的响应速度5 任务 × 5 轮平均平台首 token 延迟生成速度 (t/s)端到端延迟最差延迟 (P95)DeepSeek 官方380ms48 t/s12.5s18.2sOpenRouter520ms45 t/s14.1s23.5sSiliconFlow360ms47 t/s12.3s16.1sDeepInfra610ms42 t/s15.8s29.4s关键发现SiliconFlow 的延迟比官方还低 20ms——可能因为它在中国有节点而 DeepSeek 官方服务器也在国内链路上 SiliconFlow 做了加速。DeepInfra 的延迟最高且最不稳——P95 延迟飙到 29.4s有一轮 SQL 生成任务等了 30 多秒才出结果。OpenRouter 延迟中规中矩但如果你在国内且没翻墙根本连不上。可靠性25 次调用错误率平台成功超时500 错误限流 (429)错误率DeepSeek 官方250000%OpenRouter240104%SiliconFlow250000%DeepInfra2221012%DeepInfra 的错误率 12%——25 次调用有 3 次失败。其中 2 次是超时等了 60s 没返回1 次是 500 内部错误。这跟我之前的体验一致DeepInfra 在高峰期北京时间晚上 9-11 点稳定性明显下降。SiliconFlow 25 次全成功跟官方一样的可靠性。API 兼容性维度OpenRouterSiliconFlowDeepInfraOpenAI 兼容✅ 完整✅ 完整✅ 基本Anthropic 兼容✅ 完整✅ 基本❌ 不支持Streaming✅✅✅Function Calling✅✅⚠️ 部分模型思考模式 (thinking)✅ 透传✅ 透传❌ 不支持统一 API Key✅✅✅如果你用 DeepSeek V4 Pro 的 Anthropic 兼容端点/v1/messagesSiliconFlow 支持DeepInfra 不支持。OpenRouter 全部支持但 Anthropic 端点需要单独配置。文档质量维度OpenRouterSiliconFlowDeepInfra快速开始 (5 分钟能跑通)✅✅⚠️ 要摸索中文文档❌ 全英文✅ 完整中文❌ 全英文错误码说明✅ 详细✅ 详细⚠️ 只有 HTTP 状态码SDK / 示例代码✅ Python/JS/Go✅ Python/JS⚠️ 只有 curl定价透明✅ 每个模型标价✅ 每个模型标价✅ 定价页OpenRouter 文档最全但全是英文。SiliconFlow 中文文档写得最好——快速开始 3 分钟就能跑通。DeepInfra 的文档基本是凑合能用——需要看源码或社区帖子才能搞明白一些细节。计费方式平台计费方式起充发票余额提醒OpenRouter预充值 (Credits)$5无✅SiliconFlow预充值 (人民币)¥10✅ 可开票✅DeepInfra预充值 (USD)$10❌❌SiliconFlow 支持人民币充值和开发票——这对公司报销场景非常友好。OpenRouter 和 DeepInfra 都只支持美元且不开发票。模型覆盖对比类型OpenRouterSiliconFlowDeepInfraGPT-4o / o4mini 等✅ 全部❌ 无合规原因❌Claude 系列✅ 全部❌ 无❌DeepSeek 系列✅✅ V3/V4✅ V3Qwen 系列✅✅ 完整✅Llama 系列✅✅✅ 开源模型最全Gemini 系列✅❌❌开源模型本地蒸馏✅✅✅最便宜SiliconFlow 没有海外闭源模型GPT/Claude/Gemini这是合规限制不是技术问题。如果你的工作流需要用 GPT-4oSiliconFlow 满足不了。最终建议你的情况选哪个理由国内开发者常用 DeepSeek QwenSiliconFlow跟官方同价、中文文档好、延迟最低需要同时用 GPT/Claude/DeepSeek/GeminiOpenRouter唯一能全接的平台开源模型推理Llama/Qwen 本地蒸馏DeepInfra开源模型最便宜但稳定性和文档差公司报销、要发票SiliconFlow唯一支持人民币充值和开票在国外或科学上网下OpenRouter生态最全追求最低延迟SiliconFlow 或官方直连聚合平台总有额外一跳一个提醒为什么要走聚合平台有人会问“聚合平台还贵了为什么不直接走官方 API”理由不是省钱是运维成本你不需要管理 5 个不同的 API Key你不需要对接 5 套不同的计费系统你不需要处理 5 种不同的错误码账单一目了然方便报销聚合平台赚的就是这个统一的钱。如果你只用 DeepSeek——走官方就行更便宜。如果你用 3 个以上的模型——聚合平台值得那 15% 的溢价。

相关新闻

GRPO训练燃料:把Hermes Agent Feedback变成强化学习信号

GRPO训练燃料:把Hermes Agent Feedback变成强化学习信号

GRPO训练燃料:把Agent Feedback变成强化学习信号 「Hermes Agent自进化智能体深度解析」系列 | 模块十六 第3篇 你的Agent积累了1000条执行轨迹。500条成功,500条失败。成功的路径有的快、有的慢,失败的失败方式各不相同。你盯着这些数据&a…

2026/7/5 9:08:34 阅读更多 →
艾尔登法环mod下载法魂Modv3.0安装指南

艾尔登法环mod下载法魂Modv3.0安装指南

法魂Mod是一款热度突破680万、持续更新超过三年的《艾尔登法环》大型大修模组。3.0版本带来了全新宝珠系统、大量原创武器与法术、DLC区域地图重置等重大更新,并兼容无缝联机与光荣商人等主流功能性模组。以下为完整安装流程与多Mod共存配置方法。 版本核心更新内容…

2026/7/5 9:08:34 阅读更多 →
x64dbg:Windows 逆向分析的开源调试器

x64dbg:Windows 逆向分析的开源调试器

文章目录x64dbg:Windows 逆向分析的开源调试器它能干什么为什么逆向圈都在用1. 填补了工具断层2. 插件生态起来了3. 真正的开源底层技术栈实际体验我的建议x64dbg:Windows 逆向分析的开源调试器 搞逆向工程的人都知道,调试器是吃饭的家伙。I…

2026/7/5 9:06:34 阅读更多 →

最新新闻

知识管理实战:从用户故事驱动KARL框架落地

知识管理实战:从用户故事驱动KARL框架落地

1. 项目概述:当知识管理不再只是IT部门的PPT工程我是Jim Glenn,在Six Feet Up担任KARL Champion——这个头衔听起来有点拗口,但它的实际含义很实在:我不是来写技术文档的,也不是来推动某个特定软件上线的,而…

2026/7/5 10:17:07 阅读更多 →
高速PCB信号完整性:眼图分析与工程实践

高速PCB信号完整性:眼图分析与工程实践

1. 高速PCB设计中的信号完整性挑战 在当今GHz级高速数字电路设计中,信号完整性问题已成为工程师面临的最大挑战之一。当信号速率超过5Gbps时,PCB走线上的传输线效应、阻抗不连续、串扰和抖动等问题会显著影响系统性能。我曾参与过一个25Gbps SerDes接口的…

2026/7/5 10:17:07 阅读更多 →
AI技能安全扫描实战:从威胁模型到CI/CD集成

AI技能安全扫描实战:从威胁模型到CI/CD集成

1. 项目概述:为什么AI技能也需要“安检门”?最近在折腾AI Agent和各类AI编程工具(比如Cursor、GitHub Copilot)时,我发现一个挺有意思的现象:大家热衷于分享和下载各种“技能”(Skills&#xff…

2026/7/5 10:17:07 阅读更多 →
3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案

3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案

3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经遇到过这样的尴尬:在网易云音乐下载了心爱的歌曲,却只能在特定App里播放?车…

2026/7/5 10:15:07 阅读更多 →
RK3576芯片架构与AIoT应用开发全解析

RK3576芯片架构与AIoT应用开发全解析

1. RK3576/RK3576J芯片架构解析 Rockchip RK3576系列是瑞芯微面向AIoT和工业市场推出的高性能应用处理器,采用"44"大小核设计: 4个Cortex-A72性能核心2.2GHz(工业版2.1GHz) 4个Cortex-A53能效核心2.0GHz(工…

2026/7/5 10:15:07 阅读更多 →
RK3588核心板硬件架构与AI加速技术解析

RK3588核心板硬件架构与AI加速技术解析

1. RK3588核心板的硬件架构解析 作为当前ARM架构中的旗舰级SoC,RK3588采用了创新的"44"大小核设计。具体由4个Cortex-A76性能核心(主频2.4GHz)和4个Cortex-A55能效核心(主频1.8GHz)组成,这种组合…

2026/7/5 10:15:07 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻