510亿融资后,DeepSeek能否在AGI竞赛中继续领跑?
510亿融资后DeepSeek的新征程6月29日晚DeepSeek宣布V4正式版将于7月中旬正式上线。公告中说明为合理配置资源、提升服务稳定性正式版发布后将同步调整API定价策略引入峰谷定价机制。过去两周DeepSeek还有两件大事一是6月16日完成成立以来首轮外部融资募资总额510亿元估值将近4000亿元打破创始人梁文锋“不融资、不上市、不商业化”的原则二是融资后仅十几天6月27日DeepSeek团队联合北京大学发布论文《DSpark: Confidence - Scheduled Speculative Decoding with Semi - Autoregressive Generation》创始人梁文锋位列作者名单。如果说上半场DeepSeek要证明能做出世界一流大模型那么下半场“资本”和“技术”相汇它要向世界证明是真正的商业公司。500亿之后DeepSeek开始补人融资以来DeepSeek Harness团队新负责人崔添翼没闲着。6月25日晚DeepSeek在社交平台发布大规模招聘信息覆盖算法、研发、运维、产品、数据工程师及职能部门等7大类、共33个岗位工作地点包括北京和杭州所有岗位均接受实习。在DeepSeek官网官号、Boss直聘、X和小红书等平台能看到这位梁文锋的浙大校友、今年3月加入团队的负责人下场招人还抽空“辟谣”。此前DeepSeek像沉默、低调的技术员背靠梁文锋创办的量化私募基金“幻方量化”幻方量化2025年年化收益率56.55%管理规模超700亿元让DeepSeek不依赖外部资本外界觉得它“并不缺钱”。梁文锋改变融资态度可能是核心人才流失和外部抢人大战加速。参照系中已上市的“大模型第一股”智谱截至6月30日总市值近万亿港元MiniMax市值超1300亿港元。而DeepSeek员工期权是白纸公司不融资、不上市、无外部估值参考。一位接近DeepSeek的资深从业者表示“不融资估值不涨员工期权也不涨相比其他大模型团队DeepSeek员工留不住”。留住人才成本不小。2025年DeepSeek优势是百余人的高学历“天才”团队几十位顶尖研究员和创始人梁文锋创造出DeepSeek - R1。今年互联网大厂高薪“挖”顶级AI研究员市场对AI人才需求激增公开数据显示算法岗位月薪中位数超2.4万元头部人才月薪超5万元AI人才溢价扩大。此次大规模招聘岗位中HR、法务、财务、采购、行政等职能部门也扩招。全方位“扩编”表明DeepSeek在补齐科技公司组织能力。从“产品驱动”迈向“组织驱动”是科技公司必经之路组织成熟、平台完善、人才激励机制建立后产品红利才释放。完成500亿融资既为留人也为补全组织架构但DeepSeek扩招后能否保持“小团队作战”的精简高效和决策链灵活敏捷这是“下半场”要回答的第一个问题。DeepSeek走向重资产6月25日发布的33个招聘岗位中IDCInternet Data Center互联网数据中心数据中心团队岗位值得关注涉及基础设施建设。早在4月中旬DeepSeek就在内蒙古乌兰察布发布首批数据中心岗位包括数据中心高级运维工程师和数据中心高级交付经理6月又新增“IDC设计规划工程师”岗位。今年以来DeepSeek人才布局从模型延伸至算力基础设施建设。大模型进入规模化训练和推理阶段AI模型公司竞争进入“基础设施”硬件竞赛这使DeepSeek像硅谷前沿头部大模型公司一样加入自建算力集群的重资产“烧钱”游戏。公开数据显示美国科技巨头Alphabet、亚马逊、Meta和微软预计今年投资约6500亿美元扩大人工智能相关基础设施。Anthropic、OpenAI也强调持续加大算力基础设施投入如Anthropic预计仅数据中心容量租赁每月向SpaceX支付约12.5亿美元一年150亿美元还不包括GPU采购、网络、运维等。工信部信息通信经济专家委员会委员盘和林指出当前AI投资热潮下大模型企业融资是大势所趋“不仅DeepSeek谷歌也融资800亿美元行业进入重资本阶段”。为不在算力重资本建设上掉队DeepSeek需“开源”资金投入算力、数据中心等基础设施建设。值得注意的是DeepSeek在海外先进算力出口受限情况下建设算力基础设施意味着算力由国产芯片驱动V4发布时DeepSeek就在官方页面和技术报告里提到国产算力探索。5月底华为提出“韬τ定律”试图突破摩尔定律放缓瓶颈国产大模型加速适配国产算力目标是“自主可控的AI基础设施”。AGI的前夜对于DeepSeek这样的基础模型公司仅有资本和组织不足以长期领先关键是持续产出原创技术。一位资深算力从业者强调DeepSeek本轮大规模融资是为激励团队、留下核心人才“只有足够融资才能训出好模型奠定头部位置”。论文是DeepSeek新技术探索的缩影。近两年DeepSeek公开发表约27篇核心技术论文研究方向覆盖MoE混合专家、强化学习、代码大模型、数学推理、多模态等对应每一代核心模型和关键技术突破。6月27日DeepSeek官方在GitHub上更新一篇与“DSpark”新技术有关的论文。论文中DeepSeek提出全新推理加速框架“DSpark”不改变模型能力大幅提升大模型推理速度和系统吞吐。与此前不同这篇论文没迭代新模型而是在原有DeepSeek - V4 - Pro和DeepSeek - V4 - Flash基础上增加推测解码模块重点在工程落地层面优化。DeepSeek意图将DSpark部署在DeepSeek - V4线上服务系统、承接真实用户流量时减少无效校验带来的算力浪费。论文提及“不改变底层模型架构生成速度提高60 - 85%”。对于处理海量API请求的AI公司算力成本降低利润空间增加。据VentureBeat消息模型训练费用会越来越高Anthropic的CEO Dario Amodei预测未来一代前沿模型培训成本达50亿至100亿美元。上述资深算力从业者表示DeepSeek也将进入“烧钱”训练模型阶段。为支持模型训练迭代融资是必然。更多媒体解读融资后十几天上线新论文DeepSeek似乎证明核心节奏未变研发团队保持高频输出。不论是上新模型、建设数据中心还是从“天才实验室”转变为商业化运营的AI公司DeepSeek进化尽头是AGI。2024年梁文锋明确表态“我们做的就是AGI通用人工智能语言大模型可能是通往AGI的必经之路。”免费阶段用户能容忍响应失败、对话中断、API限流等问题。7月DeepSeek V4正式版上线后用户对稳定性要求提高问题若持续存在将影响用户是否将DeepSeek接入工作流和业务系统。来到付费端、开发者生态和企业场景DeepSeek工程能力将面临更严格考验模型能否大规模应用是进入AGI时代的门槛。用户希望DeepSeek推动中国大模型降本增效它却要留住人、持续训练模型、技术迭代数据中心基础设施建设也不能输。光靠梁文锋的幻方量化不够2026年DeepSeek启动融资是必然选择。正如6月25日晚招聘公告所说“当今人类正处于AGI的前夜。”下一步DeepSeek要面对更长期、更烧钱的AGI竞赛。能否像在“大模型”竞赛中出圈一样在AGI进程中“领跑”这是DeepSeek“下半场”要回答的第二个问题。

相关新闻

云服务器别只看CPU:一篇讲透带宽、计费与长期成本的实用指南

云服务器别只看CPU:一篇讲透带宽、计费与长期成本的实用指南

很多人第一次买云服务器,最容易盯着 vCPU、内存和首年低价,却忽略了真正决定使用体验和后续成本的几个变量:带宽、流量计费、磁盘类型、快照策略,以及厂商默认规则。结果往往是机器参数看着不差,网站一上线就慢&#x…

2026/7/3 4:13:09 阅读更多 →
ZCode对接商汤免费模型全流程教程

ZCode对接商汤免费模型全流程教程

由于AC两个蜜汁操作,确实让人无奈,于是我发现了国产codex平替(待定)ZCode! (三端皆可安装使用) 是的,zcode的界面确实和codex十分相似 同样可以使用密钥登录 1.创建账号以及创建密…

2026/7/3 4:11:09 阅读更多 →
别再每次重复写提示词了!OpenCode Skills 一招让你的 AI 编程效率翻倍

别再每次重复写提示词了!OpenCode Skills 一招让你的 AI 编程效率翻倍

一、代理技能核心概述代理技能以 SKILL.md 作为核心载体,遵循一个技能对应独立文件夹的规则。OpenCode 会自动扫描指定目录下的技能文件,代理在执行任务时可主动发现并按需加载技能内容。核心价值指令复用:将通用提示词、操作流程封装为技能&…

2026/7/3 4:09:09 阅读更多 →

最新新闻

精准分级管控:飞远光电破解化工园区员工与访客双重身份管理难题

精准分级管控:飞远光电破解化工园区员工与访客双重身份管理难题

化工园区属于高危作业场景,人员身份精细化管控是厂区安全防护的第一道核心关口。厂区内部员工、外来访客及施工承包商的作业权限、安全认知、风险等级存在本质差异:内部员工熟知厂区操作规程、作业规范及应急逃生路线,安全风险可控&#xff1…

2026/7/3 5:15:23 阅读更多 →
AI 降重造出假文献被处分?2026 实测 5 款工具:这些平台的文献 100% 可溯源

AI 降重造出假文献被处分?2026 实测 5 款工具:这些平台的文献 100% 可溯源

Gradpaper-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/课程论文。Gradpaper论文智能生成软件,10分钟生成万字毕业论文、期刊论文、文献综述、PPT,Agc查重、降重报告、文献资料。只需一个标题,从开题报告到答辩一键生成软件&a…

2026/7/3 5:13:23 阅读更多 →
二进制漏洞静态分析:cwe_checker 原理与实战解析

二进制漏洞静态分析:cwe_checker 原理与实战解析

1. 项目概述:从“黑盒”到“白盒”的洞察之旅在软件安全领域,尤其是面对那些没有源代码、只有冰冷二进制文件的场景时,漏洞挖掘常常像在黑暗中摸索。传统的动态分析(如Fuzzing)虽然有效,但存在覆盖率瓶颈&a…

2026/7/3 5:13:23 阅读更多 →
HCIP练习错题

HCIP练习错题

在ICMPv6中,路由器使用ICMPv6EchoReply报文回应收到的Request报文,那么以下描述正确的是哪些项?A. ICMPv6 Echo Reply的Type字段是129 B. ICMPv6Echo Request的Type字段是129 C. ICMPv6 Echo Request的Type字段是128 D. ICMPv6 Echo Reply的Type字段…

2026/7/3 5:13:23 阅读更多 →
纳米 AI 搜索实战应用与价值落地

纳米 AI 搜索实战应用与价值落地

在处理企业数据时,最让人头疼的往往不是数据量太大,而是数据太“散”。想象一下,你的核心业务数据躺在关系型数据库里,非结构化的文档散落在文件服务器或云存储中,而最新的行业动态却只存在于公开的网页新闻里。当业务…

2026/7/3 5:09:22 阅读更多 →
[Houndstooth节点]原理解析与实际应用

[Houndstooth节点]原理解析与实际应用

限分辨率而不产生像素化、动态调整参数实现图案变化、减少内存占用以及支持实时编辑和动画化。千鸟格图案的数学本质是一种基于平面分割的周期性函数,通过将二维空间划分为规则的网格单元,并在每个单元内根据位置关系计算黑白或彩色值的分布。Houndstoot…

2026/7/3 5:09:22 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻