用自然语言进行单细胞探索 | 《自然-方法》生物学家若要探索如今无处不在的高通量组学数据例如单细胞RNA测序生成的数据学习R或Python等编程语言来运行软件几乎是必须的。然而随着人工智能的突破一种替代范式现在成为可能。来自某研究中心的Christoph Bock发问“我们能否反过来教会计算机用英语与我们的博士生谈论他们的数据而不是强迫他们去适应计算机认为容易的方式”受这一想法启发他与同事开发了CellWhisperer这是一个基于聊天的、用于探索单细胞RNA测序数据的工具。CellWhisperer的核心是一种多模态嵌入技术它能联合建模单细胞转录组谱及其文本注释。为了学习这种嵌入团队使用了来自Gene Expression Omnibus和CELLxGENE Census的海量基因表达数据语料库并借助大型语言模型辅助整理以生成简洁、标准化的注释。Christoph Bock指出“我们将项目的大部分GPU计算时间都用在了这里。重要的是CellWhisperer是100%开放科学——不仅提供代码和模型权重还在其网站上提供了所有训练数据以供他人复用和在其基础上构建。”这是一种订阅内容的预览需通过所属机构访问。文章后续部分为期刊订阅信息、作者详情及版权声明等其内容不包含实质性技术探讨故依据准则不在此翻译呈现。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享