2026 年 3 月 6 日Sarvam 开源 30B 和 105B 推理模型。它们基于高质量数据集在印度训练在多方面表现出色尤其在印度语言基准测试中领先。模型架构特色两个模型采用混合专家Mixture - of - ExpertsMoETransformer 骨干网络。Sarvam 30B 用分组查询注意力GQA减少内存占用Sarvam 105B 增加深度并采用多头潜在注意力MLA降低长上下文推理内存需求。训练流程自主训练全流程自主开发包括预训练、监督微调、强化学习。预训练用大量数据涵盖多领域监督微调构建高质量提示语料库强化学习采用异步广义近端策略优化GRPO架构稳定高效。基准测试亮眼Sarvam 105B 在知识、推理和智能体基准测试中表现优异与多数开源和闭源前沿模型相当甚至更优在印度语言基准测试中超越所有评估模型。Sarvam 30B 虽参数少但在多方面与更大模型有竞争力。应用与未来展望Sarvam 30B 支持对话式代理平台 SamvaadSarvam 105B 支持 AI 助手 Indus。有此基础Sarvam 准备扩展到更大规模、更强大的模型。与竞品对比在各类基准测试中Sarvam 模型与国内外竞品相比毫不逊色。如 Sarvam 105B 在多个测试中超越 GLM - 4.5 - Air 等模型展现出强大实力。编辑观点Sarvam 开源模型的发布是印度 AI 发展的重要一步。其在多方面的出色表现有望打破现有 AI 格局未来或推动印度在全球 AI 领域占据更重要地位。