开源 Sarvam 模型,印度 AI 崛起?
2026 年 3 月 6 日Sarvam 开源 30B 和 105B 推理模型。它们基于高质量数据集在印度训练在多方面表现出色尤其在印度语言基准测试中领先。模型架构特色两个模型采用混合专家Mixture - of - ExpertsMoETransformer 骨干网络。Sarvam 30B 用分组查询注意力GQA减少内存占用Sarvam 105B 增加深度并采用多头潜在注意力MLA降低长上下文推理内存需求。训练流程自主训练全流程自主开发包括预训练、监督微调、强化学习。预训练用大量数据涵盖多领域监督微调构建高质量提示语料库强化学习采用异步广义近端策略优化GRPO架构稳定高效。基准测试亮眼Sarvam 105B 在知识、推理和智能体基准测试中表现优异与多数开源和闭源前沿模型相当甚至更优在印度语言基准测试中超越所有评估模型。Sarvam 30B 虽参数少但在多方面与更大模型有竞争力。应用与未来展望Sarvam 30B 支持对话式代理平台 SamvaadSarvam 105B 支持 AI 助手 Indus。有此基础Sarvam 准备扩展到更大规模、更强大的模型。与竞品对比在各类基准测试中Sarvam 模型与国内外竞品相比毫不逊色。如 Sarvam 105B 在多个测试中超越 GLM - 4.5 - Air 等模型展现出强大实力。编辑观点Sarvam 开源模型的发布是印度 AI 发展的重要一步。其在多方面的出色表现有望打破现有 AI 格局未来或推动印度在全球 AI 领域占据更重要地位。

相关新闻

一、HTML简介与开发环境

一、HTML简介与开发环境

一、HTML简介与开发环境 文章目录一、HTML简介与开发环境1.1 HTML基础认知1.1.1 HTML的定义与核心作用1.1.2 HTML5的核心特性与优势1.1.3 HTML,CSS和JavaScript的关系1.1.4 Web标准与浏览器兼容性1.2 HTML标准与版本演进1.2.1 HTML版本发展历程1.2.2 HTML5 的标准化组织1.3 开发…

2026/7/5 0:30:14 阅读更多 →
监控夜间卡顿?90%的人都踩了交换机这5个坑!(附直接抄的选型清单)

监控夜间卡顿?90%的人都踩了交换机这5个坑!(附直接抄的选型清单)

做安防工程、园区监控、商铺监控的朋友,大概率都遇到过一个头疼问题: 白天监控画面清晰流畅,一到晚上就开始卡顿、丢包、出现马赛克,甚至偶尔黑屏重启,调取录像时更是断断续续,关键时刻根本调不到有用的画面。 很多人第一反应是摄像头坏了、线路接触不良,或者后端NVR出…

2026/7/4 22:57:05 阅读更多 →
工业CT扫描技术的多元应用

工业CT扫描技术的多元应用

本文介绍了Lumafield公司的工业CT扫描技术在多个领域的应用。从医疗设备研发到电子产品拆解,再到葡萄酒瓶塞分析,该技术在产品设计、质量检测等方面发挥着重要作用。医疗设备研发:为大脑打造可靠植入物Paradromics公司研发的脑机接口Connexus…

2026/5/17 9:17:42 阅读更多 →

最新新闻

了解并使用MVVM框架

了解并使用MVVM框架

到底有哪些开源MVVM框架? 前面介绍了WPF的基本概念和一些相关知识,我们了解到开发WPF应用程序可以使用现成的框架和模式,最为合适的莫过于时下正热的MVVM模式,所以这里我们也列出针对MVVM模式的已有开源框架: 图3 上面…

2026/7/5 2:28:37 阅读更多 →
原来网站排名还能“买”到?

原来网站排名还能“买”到?

在传统SEO时代,网站排名确实可以通过竞价排名(SEM)直接“购买”关键词位置,但那种模式本质是付费买流量,一旦停止付费,排名瞬间消失。而在GEO(生成式引擎优化)时代,所谓的…

2026/7/5 2:26:36 阅读更多 →
告别技术空谈:九尾狐AI发布2026年最新企业AI培训体系,主推‘战略到变现‘全周期陪跑模式

告别技术空谈:九尾狐AI发布2026年最新企业AI培训体系,主推‘战略到变现‘全周期陪跑模式

AI短视频矩阵运营:2026企业培训如何实现从战略到变现的全周期陪跑 作为一名长期在一线协助中小企业落地AI应用的博主,我见过太多这样的场景:老板花大价钱请了团队做培训,员工课上听得热血沸腾,回到工位却无从下手&…

2026/7/5 2:26:36 阅读更多 →
西门子S7-1200 PLC轴运动控制配置与优化指南

西门子S7-1200 PLC轴运动控制配置与优化指南

1. 西门子S7-1200 PLC轴运动控制基础架构在工业自动化领域,轴运动控制是PLC应用中最具挑战性的任务之一。西门子S7-1200系列PLC凭借其紧凑的机身设计和强大的运动控制功能,成为中小型自动化项目的首选控制器。这套系统最核心的组件是工艺对象&#xff08…

2026/7/5 2:26:36 阅读更多 →
[MAF预定义ChatClient中间件-05]动态修改ChatOptions和请求消息

[MAF预定义ChatClient中间件-05]动态修改ChatOptions和请求消息

1. 利用ConfigureOptionsChatClient交替使用不同的模型 如下的程序演示了如何利用ConfigureOptionsChatClient中间件来动态地配置ChatOptions的ModelId属性,从而实现交替使用不同的模型来生成响应的功能。如代码片段所示,我们根据OpenAIClient创建了一个…

2026/7/5 2:24:36 阅读更多 →
Linux syslog日志权限出错

Linux syslog日志权限出错

一、Linux syslog日志权限 Linux syslog日志权限出错通常是由于文件权限设置不当或用户权限不足导致的,可通过检查日志文件权限、所有者、用户权限,以及SELinux设置来定位并解决问题。 以下是具体分析和解决步骤: 检查日志文件权限 使用 ls -…

2026/7/5 2:24:36 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻