ModkitOptModkitOpt 用于为运行modkit pileup命令寻找最优的--mod-threshold和--filter-threshold参数,同时为过滤 modkit 的 bedMethyl 输出结果寻找最优的化学计量比阈值,从而最大化纳米孔直接RNA修饰检测结果的精确率和召回率。为什么使用 ModkitOpt?默认情况下,modkit 采用一种启发式且未经验证的算法来量化RNA修饰,这可能会误导RNA修饰图谱的分析结果。ModkitOpt 能够识别出优化后的参数组合(--mod-threshold、--filter-threshold以及化学计量比阈值),从而改善 modkit 的性能,显著提升RNA修饰图谱分析的准确性。关于 modkit 默认启发式算法和 ModkitOpt 的更多细节可参考我们发表的论文(引用信息见下文)。ModkitOpt 的工作原理ModkitOpt 以包含 dorado 逐读段修饰检测结果的 modBAM 文件作为输入,高效且系统性地扫描 36000 种 modkit 阈值组合(--filter-threshold和--mod-threshold)以及下游化学计量比阈值,并将预测位点与经过验证的参考位点进行比对,以量化精确率和召回率。ModkitOpt 会筛选出能最大化 F1 分数(计算公式:2 ⋅ p r e c i s i o n ⋅ r e c a l l / ( p r e c i s i o n + r e c a l l ) 2 \cdot precision \cdot recall/(precision+recall)2⋅precision⋅recall/(precision+recall))的最优阈值组合,以及对应的化学计量比阈值。我们提供了哺乳动物N6-甲基腺苷(m6A)和假尿苷(pseU)的验证参考位点,若纳米孔测序数据集来自不同生物样本但包含一部分共有的验证位点,即可直接使用这些参考位点。对于其他修饰类型,用户可自行提供经过验证的位点。引用如果您使用本软件,请引用:Sneddon, Prodic Eyras. (2025).Resolving systematic bias in nanopore-based RNA modification detection. bioRxiv preprint. DOI: 10.64898/2025.12.19.695383快速开始步骤1:克隆代码仓库git clone https://github.com/comprna/modkitopt.git步骤2:安装依赖下载 modkitmodkit/