服务热线

400-533-8546
网站导航
新闻中心
当前位置: BOB半岛·体育(中国)官方网站 > 新闻中心

学术先声丨CITEdb:高质量注释的人类细胞-细胞相互作用数据库

时间:2024-09-21 21:41:37 点击次数:

  CITEdb数据库为检索细胞-细胞相互作用提供了一种方便、快捷、友好的方式,是首个在细胞类型层面建立的综合性细胞互作数据库。

  本期《学术先声》栏目分享清华大学统计学研究中心侯琳副教授研究团队与先声诊断科研团队近期合作发表在生物信息学权威期刊Bioinformatics(JCR一区,IF=6.931)上的一篇研究[1]。研究开发了一个高质量的细胞-细胞相互作用数据库-CITEdb(Cell-cell InTEraction database),该数据库涵盖人类疾病相关的728条细胞-细胞相互作用对。CITEdb首次尝试在细胞类型水平上对细胞-细胞相互作用进行梳理。数据库内的所有细胞互作对均经过严格的人工校验并具有包括生理功能和受体-配体对等详尽的注释信息。该数据库可以作为测试基准评价不同计算工具预测得到的细胞间通讯关系,为单细胞研究提供强有力的基础。

  细胞是多细胞生物的基本单位。生命体的复杂活动离不开细胞间的相互作用(CCIs,cell-cell interactions)。细胞间的通讯方式包括细胞间直接交流(例如缝隙连接、细胞黏附和配体-受体间互作等)和细胞间间接交流(例如自分泌、旁分泌、内分泌等)。传统的CCIs研究依赖于实验手段(例如细胞共培养),近年来,以单细胞转录组(single cell transcriptomics)技术为代表的单细胞技术迅猛发展,使得预测CCIs成为可能。随着人们对细胞间互作关系的深入理解和机制研究,CCIs在癌症及其他疾病的药物和疗法开发等方面正发挥着越来越重要的作用。 为了更好地研究细胞间互作关系,截止目前,研究者们已建立多个相关的数据库。Cell Interaction Knowledgebase和EndoNet是早期开发的两个细胞互作数据库,主要关注的是依赖细胞因子、激素的细胞间通讯关系。除此之外,在单细胞领域,出现了CellChat和CellphoneDB等基于受体-配体对的细胞互作数据库。然而截止目前,尚未建立一个细胞类型层面上的细胞互作数据库。 基于此,本研究开发了CITEdb数据库,该数据库的CCIs来源于严格的文献提取和校验。另外,数据库为每一种 CCIs提供生物学功能和验证手段等详尽的注释信息。数据库可通过进行访问,具备检索、可视化和下载等功能的交互式操作界面。CITEdb功能强大,不仅能探索以往发现的细胞互作对,而且能够作为单细胞研究基准测试的数据来源。

  本研究首先以“cell to cell interaction(s)”、“human(s)”和“cell type(s)”等为关键词,通过PubMed数据库共获得509篇最相关的文献。接着,对文章中的内容进行仔细的阅读和对关键信息的提取和处理。对于数据库中的细胞类型,我们以CellMarker数据库为准进行了标准化处理。对于器官和疾病等字段,则严格按照MeSH 进行分类。细胞互作的验证方法分为计算方法预测和实验两类。总之,CITEdb共涵盖了728条人类疾病相关的细胞-细胞相互作用,涉及204个生理背景。其中出现频率最多的背景是“免疫应答”、“骨微环境”、“癌症发生”和“乳腺癌”。

  CITEdb提供非常友好的使用界面(图1)。通过“搜索”栏,用户可以根据感兴趣的细胞类型或背景,从可选框中选择一到多个字段。如果需要对验证手段进行筛选,可以在左下方的选bob半岛在线登录项卡“方法”选择相应的字段。相关的示例可以通过点击“Demo1”或“Demo2”按钮进行查看。选择完毕后,会自动弹出细胞与细胞的互作网络图。点击网络图的节点,将显示CITEdb中包含此细胞类型互作对的数目。点击网络图的边,将显示细胞交流所涉及的中介信息。网络图的下方表格展示的是互作对的详细注释信息,包括文献发表年份生物学功能等。输出的结果图表均可自由下载。CITEdb还为研究者提供整个数据集的下载功能。

  为了让研究者更好地使用CITEdb,本研究还介绍两个实际案例。案例1是以“免疫应答”为关键词检索,点击“搜索”按钮后,下方会自动弹出免疫应答相关的细胞与细胞互作网络图,如图2所示。

  应用案例2是研究者希望借助CITEdb,为单细胞转录组测序预测的细胞互作对,找到相应的文献支持以及识别出以往研究未报道的互作对。 为了模拟这一应用场景,本研究下载了来自19位黑色素瘤的scRNA-seq数据集,该数据集包含4645个细胞和23686个基因。我们考虑了非恶性细胞类型,包括B细胞、内皮细胞、肿瘤相关成纤维细胞、巨噬细胞、NK细胞和T细胞。这些细胞类型在CITEdb数据库存在36种细胞互作对,其中包括6种自身互作和30种定向互作。本研究借助LIANA工具包,对该数据集分别使用SingleCellSignalR、CellPhoneDB、CellChat、Connectome、iTALK和NATMI软件进行细胞互作网络推断。推断结果使用通讯总分(The sum of communication scores,sum)和起作用的受体-配体对数量(The count of active ligand-receptor pairs,count)两种方法进行汇总。另外,使用Bray-Curtis score和enrichment score两种算法统计了无向互作类型。不同方法的预测性能利用Precision-Recall 曲线(PR curve)进行比较。结果显示,对于定向细胞互作关系,当使用sum方法进行统计时,NATMI和SingleCellSignalR预测性能最佳,而当使用count方法时,Connectome表现最好。对于无向通讯关系,Bray-Curtis score和enrichment score的预测性能相差不大,ROC曲线下的面积(AUC)分别为0.888和0.904(图3)。综上所述,CITEdb数据库能够为研究者的scRNAseq细胞通讯结果提供非常便捷的查询和验证渠道。

  图3. 在黑色素瘤单细胞数据集中以CITEdb数据库为基准比较不同算法对细胞-细胞相互作用的预测性能

  CITEdb数据库为检索细胞-细胞相互作用提供了一种方便、快捷、友好的方式,是首个在细胞类型层面建立的综合性细胞互作数据库。同时,我们为用户提供一个利用CITEdb数据库作为基准自动化评价不同计算工具得到的细胞通讯关系的软件()。该数据库为每个细胞互作对提供详尽的注释信息,有助于推动实验科学、计算机科学和临床研究等领域的细胞互作研究。 合作单位及文章参与者:首都经济贸易大学统计学院Nayang Shan,清华大学统计学研究中心Yao Lu和Dongyu Li;美国密歇根大学数学系Jitong Jiang,复旦大学类脑智能科学与技术研究院Xingming Zhao。

Copyright © BOB半岛·体育(中国)官方网站 版权所有  

地址:广东省广州市BOB半岛·体育(中国)官方网站 电话:400-533-8546 邮箱:derfloor.com

关注我们