StabCell:用于单细胞RNA测序中聚类与标记物检测的稳定性选择

研究动机: 传统的单细胞RNA测序(scRNA-seq)数据差异表达分析流程通常先对单个细胞进行聚类,然后在所得簇之间检验差异表达基因。然而,使用同一数据同时进行聚类和检验会带来选择性推断问题,并可能导致对差异的过度自信,而这些差异未必反映真实的生物学变异。 研究结果: 我们提出了StabCell,一个整合聚类与差异表达标记基因检测的稳定性选择框架。通过在互补随机子样本中反复进行聚类和差异表达分...
生物信息学

研究动机: 传统的单细胞RNA测序(scRNA-seq)数据差异表达分析流程通常先对单个细胞进行聚类,然后在所得簇之间检验差异表达基因。然而,使用同一数据同时进行聚类和检验会带来选择性推断问题,并可能导致对差异的过度自信,而这些差异未必反映真实的生物学变异。

研究结果: 我们提出了StabCell,一个整合聚类与差异表达标记基因检测的稳定性选择框架。通过在互补随机子样本中反复进行聚类和差异表达分析,StabCell评估聚类及标记基因的稳定性,从而得到稳定的聚类结果及稳定标记基因集合。在模拟研究中,我们表明StabCell能够提供近似的经验家族错误率(per-family error rate, PFER)控制,与传统方法相比可筛选出更少的假阳性标记基因,尤其是在信噪比较低和测序深度较低的情况下。

将该方法应用于诱导多能干细胞(IPSCs)向心肌细胞分化的细胞分化数据集表明,有意义的标记基因始终位于排序最前的基因之中。这些结果表明,StabCell能够提高scRNA-seq分析的可解释性与稳健性。

可获得性与实现: StabCell在统计编程语言R中的实现可从https://github.com/LuckyLueck/StabCell获取。用于复现结果的代码可从https://github.com/LuckyLueck/StabCell_paper获取。

感谢您关注并帮助传播bioRxiv上的研究成果。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.07.720061v1?rss=1

🏷️ 单细胞RNA测序 稳定性选择 聚类分析 差异表达分析 标记基因检测 统计推断

Administrator 2026年5月15日
我们的博客
存档