稀疏性是你所需要的一切:重新思考深度学习中的生物路径引导方法
文章总结1、近期生物先验相关的研究比较多,例如pathformer、DeePathNet、DeepKEGG等,将pathway通路等生物先验知识结合到神经网络模型中,并在疾病分类、生存分析、风险预测等下游任务中有着良好的表现,是研究的热点之一;2、作者通过研究,认为生物先验引导的生物网络,性能提升主要是源于网络结构的稀疏性,而非源自生物学相关性。作者将生物引导的神经网络,改成基于随机信息的模型,随机信息模型和生物引导的神经网络稀疏性相当,此时模型在不同指标和数据集下的表现和生物引导模型相近,甚至有3个模型的随机版本表现优于生物学引导版本。3、对后续研究思考:在加入生物先验知识时,需要补充实验,如果将生物先验换成具有相似稀疏性的随机网络,如泊松分布、伯努利分布等,模型性能是否会发生变化。需要验证性能的提升是归因于稀疏性还是生物先验知识。4、仅靠稀疏度,若不包含生物学知识,往往就足够了。这可能导致生物学知情模型的开发方式转变,更多关注结构性优势如稀疏性,而非具体生物数据的整合。 未来工作应持续通过比较模型性能与随机对应模型来验证通路整合。此类比较将确保生物信息的整合不仅仅带来稀缺,还能真正增强预测能力。摘要生物引导神经网络通常利用通路注释来提升生物医学应用的性能。我们假设通路整合的益处并非源于其生物学相关性,而在于它带来的稀疏性。我们对所有相关的基于路径的神经网络模型进行了全面分析,批判性地评估了每项研究的贡献。通过本次评测,我们筛选出部分源代码公开的方法子集。比较基于生物信息的先进深度学习模型与其随机对应模型显示,基于随机信息的模型在不同指标和数据集下的表现与生物引导模型相当。值得注意的是,在15个分析模型中,有3个随机版本的表现甚至超过了其生物学引导版本。此外,通路引导模型在可解释性上并无明显优势,尽管缺乏显性通路信息,随机模型仍能识别相关的疾病生物标志物。我们的发现表明,通路注释可能噪声过大或现有方法探索不足。因此,我们提出了一种可应用于不同领域的方法论,并可作为系统比较新路径知情模型与其随机对应模型的坚实基准。这种方法使研究人员能够严格判断观察到的性能提升是否归因于生物学洞察。背景与总结在处理深度学习模型时,许多通过机器学习方法高效计算的函数表现出所谓的“合成稀疏性”,意味着它们可以分解成几个更简单的函数,每个函数仅依赖于输入的子集。深度网络,如卷积神经网络(CNN)和Transformer,与许多目标函数的组成结构相符,从而实现更好的推广,因为它们能高效地近似这些函数,而不会陷入“维度诅咒”,即输入维度为 [37, 12, 31, 13, 32] 的指数级增长。通过引入先验约束来进一步增强这种组合稀疏性,比如将特征分组为概念或建模它们之间的相互作用。这种方法与结构化稀疏性和层级特征学习[2]相符,这些也在多项深度学习研究中被探讨过[39, 38, 34]。生物知情模型利用功能注释数据库中的生物知识来增强学习过程并提升预测性能[11, 6]。许多方法基于神经网络架构,将通路注释视为生物信息。例如,其中一些模型采用多层感知器(MLP),通过修改神经连接以纳入生物通路。这些架构的设计可能很简单,使用单一隐藏层[7, 33],并使用与通路层[30]关联的全连接网络,采用稀疏编码机制,通过丢弃增强稀疏效应,同时结合基因通路修剪连接[8, 9, 10, 4]。另一种整合方式是修改所有中间层,采用通路信息,拟合顺序神经网络结构[6, 14, 11],或使用并行全连通网络,包含所有基因特征,因此也包括与通路无关联的特征[17]。最近,生物知情深度学习模型还引入了自注意力机制到组学通路层[19],变换器增强通路与不同数据模态之间的交互[24],甚至变分自编码器生成潜在数据表示,将通路信息整合进编码器[15]。因此,所有这些方法都塑造了网络拓扑结构,确保功能相关的基因产物(或其他生物实体)与同一神经元共享连接,同时根据通路注释进行连接修剪。利用通路信息的另一种方法是将输入数据转换为通路关系,从而支持为非表格数据设计的神经网络架构。这些架构的例子包括图神经网络(GNNs)[20],它可以将基因相关特征作为节点,根据特定路径的关系表示特定路径[21],或者将路径作为节点和边,反映路径交互,通过图卷积层[23]或注意力机制[26]加以利用。一种互补的数据转换策略是构建一个二维“通路图像”,直接将基因-通路关联编码到矩阵中,基因表达水平以“像素强度”表示。这种格式使标准架构如卷积神经网络能够利用路径提供的结构信息来完成预测任务[29]。或者,这些

相关新闻

从登录异常到底层逻辑:彻底吃透Session、ThreadLocal与拦截器的协同机制

从登录异常到底层逻辑:彻底吃透Session、ThreadLocal与拦截器的协同机制

在开发Java Web项目(本文以黑马点评项目为例)时,相信很多开发者都会遇到这样的问题:登录成功后,点击“我的”页面却被重新跳回登录页。看似简单的登录异常,背后却牵扯到Session、Cookie、拦截器、ThreadLoc…

2026/5/17 11:52:53 阅读更多 →
淘宝商家如何发送联系方式给客户,从技术的角度看我们怎么解决这个问题!

淘宝商家如何发送联系方式给客户,从技术的角度看我们怎么解决这个问题!

行业背景:服务体验成为新竞争点 随着电商行业进入存量竞争时代,平台对商家服务质量的要求日益提升。传统的“售卖结束即服务结束”模式已不再适用,全生命周期的客户服务(Customer Service Lifecycle)成为衡量店铺竞争…

2026/7/3 9:09:56 阅读更多 →
ONNX 和 TensorRT是什么

ONNX 和 TensorRT是什么

ONNX 和 TensorRT 都是深度学习模型部署(inference/推理)阶段常用的工具,但它们的作用不同,可以理解为 “中间格式 加速引擎”。 我用简单方式解释 👇 1️⃣ ONNX 是什么 ONNX(Open Neural Network Exch…

2026/5/17 11:52:49 阅读更多 →

最新新闻

从“是什么“到“为什么“:现代系统诊断工具witr如何重新定义进程分析范式

从“是什么“到“为什么“:现代系统诊断工具witr如何重新定义进程分析范式

从"是什么"到"为什么":现代系统诊断工具witr如何重新定义进程分析范式 【免费下载链接】witr Why is this running? 项目地址: https://gitcode.com/GitHub_Trending/wi/witr 在当今复杂的系统环境中,当进程异常消耗资源、端…

2026/7/4 8:29:19 阅读更多 →
如何用Flask-profiler定位最耗时的API端点?实战案例分享

如何用Flask-profiler定位最耗时的API端点?实战案例分享

如何用Flask-profiler定位最耗时的API端点?实战案例分享 【免费下载链接】flask-profiler a flask profiler which watches endpoint calls and tries to make some analysis. 项目地址: https://gitcode.com/gh_mirrors/fl/flask-profiler Flask-profiler是…

2026/7/4 8:29:19 阅读更多 →
FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术

FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术

FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术 【免费下载链接】FlipperZeroHondaFirmware Custom Firmware for the Flipper Zero, to add support for Honda key fobs (FCC ID: KR5V2X) 项目地址: https://gitcode.com/gh_mirrors/fl/Flippe…

2026/7/4 8:23:17 阅读更多 →
大模型‘养虾测试’:评估世界模型与长程一致性新标尺

大模型‘养虾测试’:评估世界模型与长程一致性新标尺

1. 项目概述:当“养虾”成为大模型能力测试的新标尺最近在好几个技术群和行业论坛里,频繁看到有人甩出一句:“来,养只虾试试?”——不是水产养殖交流,也不是美食探店邀约,而是工程师、产品经理、…

2026/7/4 8:19:17 阅读更多 →
智能解析技术赋能教育数字化转型:tchMaterial-parser的技术架构与应用实践

智能解析技术赋能教育数字化转型:tchMaterial-parser的技术架构与应用实践

智能解析技术赋能教育数字化转型:tchMaterial-parser的技术架构与应用实践 【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台 电子课本下载工具,帮助您从智慧教育平台中获取电子课本的 PDF 文件网址并进行下载,让您更方便地获取课…

2026/7/4 8:15:16 阅读更多 →
从0到1构建Flask性能监控系统:Flask-profiler完全指南

从0到1构建Flask性能监控系统:Flask-profiler完全指南

从0到1构建Flask性能监控系统:Flask-profiler完全指南 【免费下载链接】flask-profiler a flask profiler which watches endpoint calls and tries to make some analysis. 项目地址: https://gitcode.com/gh_mirrors/fl/flask-profiler 想要快速提升Flask应…

2026/7/4 8:15:16 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻