计算生物学
单细胞分辨率的空间转录组学(ST)能够在其原生空间背景下描绘基因表达,但相当一部分转录本会污染邻近细胞,从而损害下游生物学分析。现有去污染方法依赖启发式先验,要么忽略污染的空间结构,要么对邻居进行聚合而不区分污染与本底表达,因而使分解过程具有歧义。为解决这一歧义,我们提出 DeSpotX,这是一种深度生成模型,利用锚定基因(anchor genes)——即在给定细胞簇中本不表达的基因——来约束污染分解并使其可识别。
DeSpotX 进一步利用空间信息,通过对邻近细胞进行带簇掩码、距离加权的平均来局部估计污染,并通过学习得到的扩散先验防止对低表达信号的过度校正。在五个数据集和四种 ST 平台上的 spike-in 模拟中,DeSpotX 在每个数据集上的 AUROC 均超过 0.94,相较于最佳基线提升 0.02 至 0.12,并且对细胞簇注释和锚定基因构建中的不准确性仍保持稳健。在真实组织上,我们表明去污染后的计数能够提高标记基因特异性,产生更具空间一致性的表达,并构建与已知生物学一致的细胞—细胞通讯网络。
我们进一步表明,交替进行去污染与细胞簇注释可进一步优化这些结果,并在小鼠脑和乳腺癌组织中将配体—受体信号重新分配至预期的源细胞。
作者声明不存在竞争性利益。
注:我们仅请求您的电子邮件地址,以便将您识别为本文的发送者。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.12.724704v1?rss=1
🏷️ 空间转录组 去污染 深度生成模型 锚定基因 细胞通讯