OpenAI首次在Cerebras芯片上部署AI模型
OpenAI于周四发布了GPT-5.3-Codex-Spark这是其首个运行在Cerebras Systems餐盘大小AI加速器上的模型。该加速器搭载了世界上最快的片上内存技术。这款轻量级模型旨在通过Cerebras的SRAM封装CS3加速器为OpenAI的Codex代码助手用户提供更具交互性的体验生成响应速度超过每秒1000个Token。上个月OpenAI与Cerebras签署了100亿美元的合同部署多达750兆瓦的定制AI芯片来服务Altman团队的最新一代GPT模型。Cerebras的晶圆级架构采用了一种名为SRAM的超快片上内存其速度比英伟达今年CES上发布的即将推出的Rubin GPU中的HBM4内存快约1000倍。结合推理和应用管道的优化OpenAI的最新模型能够在眨眼间生成答案。由于Spark是专有模型我们无法获得参数数量等详细信息不像OpenAI去年8月在HuggingFace上发布gpt-oss时那样。我们知道的是与那个模型一样它是一个纯文本模型拥有128,000个Token的上下文窗口。模型的上下文窗口是指它能同时跟踪的Token词汇、标点符号、数字等数量通常被称为模型的短期记忆。虽然128K个Token听起来很多但由于模型必须跟踪现有代码和新生成的代码像Codex这样的代码助手可能很快就会用完。即使从空白开始以每秒1000个Token的速度大约两分钟就会超出上下文限制。这可能是OpenAI表示Spark默认采用轻量级风格的原因只进行最小的针对性编辑除非特别要求否则不会运行调试测试。快速的模型如果不能编写有效代码就没有太大价值。据OpenAI称Spark模型在Terminal-Bench 2.0测试中比GPT-5.1-Codex-Mini提供更高的准确性同时比更智能的GPT-5.3-Codex模型快得多。OpenAI可能正在寻求GPU之外的选择但短期内肯定不会放弃GPU。OpenAI写道GPU在我们的训练和推理管道中仍然是基础为广泛使用提供最具成本效益的Token。Cerebras通过在需要极低延迟的工作流程中表现出色来补充这一基础。这不仅仅是表面文章。尽管Cerebras的CS3加速器速度很快但在内存容量方面无法与现代GPU匹敌。SRAM虽然快速但空间效率不高。整个餐盘大小的芯片仅包含44GB内存。相比之下英伟达的Rubin将配备288GB的HBM4而AMD的MI455X将搭载432GB。这使得GPU在运行大型模型时更经济特别是在速度不是优先考虑因素的情况下。话虽如此OpenAI建议随着Cerebras提供更多计算资源它将把更大的模型引入该计算平台这大概是为那些愿意为高速推理付费的用户准备的。GPT-5.3-Codex-Spark目前向Codex Pro用户提供预览版并通过API向特定的OpenAI合作伙伴开放。QAQ1GPT-5.3-Codex-Spark有什么特别之处AGPT-5.3-Codex-Spark是OpenAI首个运行在Cerebras Systems AI加速器上的模型该加速器采用SRAM片上内存技术速度比英伟达GPU中的HBM4内存快约1000倍。该模型专为代码助手设计能以每秒超过1000个Token的速度生成响应为用户提供更具交互性的编程体验。Q2为什么OpenAI选择与Cerebras合作而不是继续只用GPUAOpenAI与Cerebras签署了100亿美元合同主要是为了获得极低延迟的推理能力。虽然GPU在训练和推理管道中仍然是基础且更具成本效益但Cerebras的SRAM技术在需要极速响应的工作流程中表现出色两者形成互补关系而非替代关系。Q3GPT-5.3-Codex-Spark的上下文窗口有什么限制A该模型拥有128,000个Token的上下文窗口虽然看似很大但由于需要跟踪现有代码和新生成的代码在每秒1000个Token的生成速度下大约两分钟就会达到上下文限制。因此模型默认采用轻量级风格只进行最小的针对性编辑。

相关新闻

Fastly第四季度业绩大超预期,股价暴涨30%并上调2026年预测

Fastly第四季度业绩大超预期,股价暴涨30%并上调2026年预测

云端边缘基础设施和内容分发网络提供商Fastly公司在发布2025财年第四季度财报后,股价在盘后交易中暴涨超过30%。该公司不仅在营收和盈利方面均超出预期,还给出了远超分析师预期的前景展望。强劲的第四季度表现截至12月31日的第四季度,Fastly调…

2026/7/5 0:27:16 阅读更多 →
斯坦福与英伟达联合:AI训练为什么“炒冷饭“比“吃新鲜“更有效?

斯坦福与英伟达联合:AI训练为什么“炒冷饭“比“吃新鲜“更有效?

这项由纽伦堡科技大学、Mistral AI和英伟达联合开展的研究发表于2026年2月,论文编号为arXiv:2602.11149v1。有兴趣深入了解的读者可以通过该编号查询完整论文。当我们教孩子学数学时,通常会让他们反复练习同一类题目,直到完全掌握为止。但在人…

2026/7/5 0:27:17 阅读更多 →
基于Python的在线选课系统[python]-计算机毕业设计源码+LW文档

基于Python的在线选课系统[python]-计算机毕业设计源码+LW文档

摘要:随着高校教育信息化的不断推进,在线选课系统成为教学管理信息化的重要组成部分。本文设计并实现了一个基于Python的在线选课系统,详细阐述了系统的需求分析、技术选型、架构设计、功能模块实现以及测试过程。该系统实现了学生选课、教师…

2026/5/17 4:37:25 阅读更多 →

最新新闻

AI绘画提示词编写与优化全指南

AI绘画提示词编写与优化全指南

1. AI绘画提示词(Prompt)编写核心逻辑解析AI绘画的核心在于将自然语言描述转化为视觉元素,这个过程本质上是一种跨模态的信息转换。理解这个转换机制是编写优质Prompt的基础。现代AI绘画模型如Stable Diffusion、MidJourney都建立在扩散模型(Diffusion Model)架构上…

2026/7/5 0:25:48 阅读更多 →
如何在Windows家庭版上启用专业级远程桌面:RDP Wrapper Library终极指南(2024版)

如何在Windows家庭版上启用专业级远程桌面:RDP Wrapper Library终极指南(2024版)

如何在Windows家庭版上启用专业级远程桌面:RDP Wrapper Library终极指南(2024版) 【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap 你是否曾经因为Windows家庭版无法使用远程桌面功…

2026/7/5 0:21:46 阅读更多 →
2025年Nmap渗透测试实战指南:从基础扫描到高级规避技术

2025年Nmap渗透测试实战指南:从基础扫描到高级规避技术

1. 项目概述:为什么Nmap依然是渗透测试的基石如果你在网络安全这个行当里待过一阵子,或者哪怕只是刚入门,大概率都听过Nmap这个名字。它就像木匠手里的锤子,厨师手里的刀,是那种你明知道它“古老”,但每次开…

2026/7/5 0:17:44 阅读更多 →
WPF可视化设计工具终极指南:如何用WpfDesigner让界面开发效率提升3倍?

WPF可视化设计工具终极指南:如何用WpfDesigner让界面开发效率提升3倍?

WPF可视化设计工具终极指南:如何用WpfDesigner让界面开发效率提升3倍? 【免费下载链接】WpfDesigner The WPF Designer from SharpDevelop 项目地址: https://gitcode.com/gh_mirrors/wp/WpfDesigner 还在为WPF界面开发中的繁琐XAML代码而烦恼吗&…

2026/7/5 0:15:43 阅读更多 →
基于YOLOv8的猫狗品种识别系统开发实战

基于YOLOv8的猫狗品种识别系统开发实战

1. 项目概述:基于YOLOv8的猫狗品种识别系统这个项目本质上是一个计算机视觉领域的典型应用——利用YOLOv8目标检测算法实现猫狗品种的自动识别。我在实际部署中发现,相比传统图像处理方法,深度学习方案在复杂场景下的识别准确率能提升40%以上…

2026/7/5 0:13:42 阅读更多 →
从零实现SHA-1哈希算法:原理、代码与性能优化实战

从零实现SHA-1哈希算法:原理、代码与性能优化实战

1. 项目概述:从“知其然”到“知其所以然”的SHA-1实现之旅在信息安全领域,哈希算法扮演着数据完整性校验和数字签名的基石角色。SHA-1(Secure Hash Algorithm 1)作为曾经的主流算法,虽然因其安全性问题已不再被推荐用…

2026/7/5 0:13:42 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻