科学研究
报告题目:

单细胞数据缺失值插补的若干问题研究

报告人:

张本龚 教授(武汉纺织大学)

报告时间:

报告地点:

理学院东北楼四楼报告厅(404) 腾讯会议 ID:784 505 231 会议密码:0629

报告摘要:

细胞是构成生命的基础单元,生物学表征的研究,离不开对细胞的深入分析。无论是单细胞生物还是多细胞生物,单个细胞之间的差异都可以产生不可估量的影响。迅速发展的单细胞转录组测序(scRNA-seq,single cell RNA sequencing)技术为在高通量、高分辨率的单细胞层面研究细胞功能及其背后的基因调控机制提供了重要技术手段。单细胞测序可以检测不同的组学种类,例如,转录组、染 色质开放组、DNA甲基化组、组蛋白修饰组等。对于不同组学技术 产生的数据进行整合分析有助于更全案的刻画细胞内的基因调控状 态、解释调控机制。然而,与传统Bulk数据相比,单细胞数据具有规模大、噪音高、异构性强等特点。虽然单细胞测序技术为深入研究 细胞功能提供了机会,然而这项技术也带来新的挑战由于其不同组学单细胞数据具有上述特点,特别是高噪音中数据缺失(dropout与批次效应(batch effect)严重影响了下游分析的可靠性,以及掩盖了基因与基因间的重要关系。本次报告主要聚焦如何对多组学单细胞数 据缺失值进行插补的若干问题进行研究。我们提出两种插补的策略:第一、基于负二项分布的分治插补;第二、基于图注意力网络的深度学习插补策略。分别用聚类评估和插补评估,在不同的单细胞数据集进行了验证,表现出良好的聚类和插补效果。