细胞间相互效果(CCIs)在细胞分化、安排稳态和免疫反响等许多生物过程中发挥着要害效果。随着高通量单细胞RNA测序(scRNA-seq)技能的快速发展,从不断添加的 scRNA-seq 数据中辨认CCIs变得非常重要。但是,受算法限制,当前根据统计战略的计算办法忽略了高度稀少性和异质性的 scRNA-seq 数据中包括的一些要害潜在信息。
哈尔滨工业大学和南边医科大学的研讨团队开发了一个名为 DeepCCI 的深度学习结构,用于从 scRNA-seq 数据中辨认有意义的 CCI。在灵活且易于运用的软件的支撑下,DeepCCI 能够供给一站式解决方案,以发现有意义的细胞间相互效果并从 scRNA-seq 数据构建 CCI 网络。
该研讨以「DeepCCI: a deep learning framework for identifying cell–cell interactions from single-cell RNA sequencing data」为题,于 2023 年 9 月 23 日发布在《Bioinformatics》。
多细胞生命依赖于细胞活动的一致性,而细胞活动又取决于不同细胞类型之间的细胞间相互效果(CCI)。单细胞 RNA 测序(scRNA-seq)技能以前所未有的分辩率水平在了解细胞机制方面取得了显著进展。尽管 scRNA-seq 数据本质上包括可用于辨认细胞间通讯的基因表达信息,但探究一般驱动异质性和细胞状况转换的潜在 CCI 仍然是一个巨大的挑战。
细胞背后的信号传导事情一般由各种类型蛋白质的相互效果介导,包括配体-受体(L-R)、受体-受体和细胞外基质-受体相互效果。特别是,多亚基 L-R 复合物对于 CCI 至关重要。一些蛋白质,例如 TGF-(转化生长因子-)受体10 和细胞因子受体,需求多亚基组装才能发挥功用。详细而言,在 TGF- 信号通路中,可溶性配体 TGFB1 与 I 型和 II 型受体(TGFBR1和TGFBR2)的异聚复合物之间的相互效果在糖尿病肾病的发生发展中发挥着重要效果。
为了从 scRNA-seq 数据中辨认 CCI,根据 L-R 基因对开发了几种计算战略,例如 SingleCellSignalR、iTALK、CellPhoneDB 和 CellChat。每个战略都包括细胞间相互效果先验知识资源和辨认潜在 CCI 事情的办法。但是,这些战略的辨认成果一般遭到从前 L-R 基因对数据库的全面性的限制。每种办法中运用的不同 L-R 对数据库或许有助于辨认相互效果的多样性。此外,辨认异质 scRNA-seq 数据中从前未表征的细胞类型是辨认 CCI 的前提。
但是,这些办法不能在相互效果辨认之前将细胞独立地分类为细胞簇。此外,由于目前捕获单细胞蛋白质组信息的技能困难,定义 CCI 网络的基本现实具有挑战性。最近,根据深度学习的办法在广泛的单细胞研讨中展现了它们的实力。但是,目前还没有根据 scRNA-seq 数据进行 CCI 猜测的深度学习结构。scRNA-seq 数据与深度学习技能的结合将得到极大扩展,为 CCI 猜测供给共同的见地。
在最新的研讨中,哈尔滨工业大学和南边医科大学的研讨团队开发了 DeepCCI,这是一种根据图卷积网络 (GCN) 的深度学习结构,用于从 scRNA-seq 数据中辨认 CCI。为了一站式从 scRNA-seq 数据探究细胞之间的相互效果,
图示:DeepCCI的作业流程。(来历:论文)
DeepCCI 供给了两种深度学习模型:(i) 用于细胞聚类的根据 GCN 的无监督模型,以及 (ii) 用于 CCI 辨认的根据 GCN 的监督模型。DeepCCI 经过运用 scRNA-Seq 数据中异质细胞的潜在复杂基因表达模式,在细胞聚类和捕获细胞簇之间具有生物学意义的相互效果方面具有巨大潜力。
DeepCCI 首要学习一个嵌入函数,该函数运用主动编码器 (AE) 和 GCN 将单元联合投影到同享嵌入空间中。经过运用嵌入信息,DeepCCI 将细胞分为几组。然后,该团队手动策划了一个名为 LRIDB 的综合信号分子相互效果数据库,用于与多亚基的 L-R 相互效果。根据 LRIDB,DeepCCI 能够猜测给定 scRNA-seq 数据中任何一对簇之间的细胞间串扰。
此外,DeepCCI 还供给了多种可视化输出,以显示每个细胞簇与其他每个细胞簇相互效果的强度或详细程度。研讨人员经过将 DeepCCI 应用于几个揭露可用的 scRNA-seq 数据集来展现 DeepCCI 的全体功用。成果表明,DeepCCI 在根据 scRNA-seq 数据进行细胞类型聚类和 CCI 猜测方面,在捕获细胞之间的生物学关系方面具有超卓的潜力。
尽管研讨人员根据最全面的 L-R 对数据库和几种揭露的统计办法定义了重要的 CCI,但由于缺少基本现实,对猜测的 CCI 进行体系评价具有挑战性。空间分辩转录组技能的最新进展为探究安排中细胞的空间安排供给了时机。因而,整合 scRNA-seq 和空间转录组学数据或许会添加科学家对特定细胞亚群的效果及其在发育、稳态和疾病中相互效果的了解。
未来,该团队将继续增强 DeepCCI 以支撑单细胞多组学测序 (scMulti-seq) 数据的整合,并纳入空间转录组学,使剖析更易于解说。研讨人员计划根据 DeepCCI 模型开发一个愈加用户友爱的软件体系,并结合模块化剖析功用,支撑数据格式标准化、质量控制、数据集成、多功用 scMulti-seq 剖析、功能评价和交互式可视化。
DeepCCI 的源代码:github.com/JiangBioLab…
论文链接:academic.oup.com/bioinformat…



