人类胚胎单细胞分析揭示非整倍体和嵌合体现象的多样化模式

不到一半的人类合子能够存活至活产，主要原因是源于减数分裂或有丝分裂的非整倍体。有丝分裂错误会导致染色体嵌合性，其定义为存在具有不同染色体组成的多个细胞谱系。人类胚胎中染色体嵌合性的发生率及其对适合度的影响仍存在争议，因为以往大多数研究均基于群体DNA检测，或对少量胚胎细胞进行多次活检比较。单细胞基因组数据为在整个胚胎尺度上定量评估嵌合性提供了机会。为此，我们扩展了一种基于基因表达中与染色体剂量相关...

遗传学

我们将该方法应用于已发表的74个解离人类胚胎的单细胞RNA测序数据，这些胚胎涵盖了从桑椹胚到囊胚阶段。我们的分析显示，在植入前发育过程中广泛存在嵌合性非整倍体：74个胚胎中有59个（80%）至少含有一个非整倍体细胞（1% FDR）。通过对拷贝数判定结果进行聚类，我们重建了染色体错误分离的历史，区分了减数分裂及早期有丝分裂错误与谱系分化后发生的错误。我们未观察到与内细胞团相比，滋养外胚层中非整倍体细胞存在显著富集；不过，在已发表的植入后较晚阶段数据中，我们确实检测到了这种富集。

最后，我们观察到非整倍体细胞表现出免疫应答基因上调，以及参与增殖、代谢和蛋白质加工的基因下调，这与此前在其他发育阶段和系统中记录到的应激反应一致。总之，我们的工作提供了植入前胚胎中非整倍体的高分辨率图景，并支持这样一个结论：低水平嵌合性是人类早期发育的常见特征。

研究染色体嵌合性发生率及其影响的一个主要局限在于，大多数推断均基于群体DNA检测，或对少量胚胎细胞进行多次活检比较。因此，目前对人类胚胎中嵌合性的估计范围从4%到90%（

单细胞基因组数据集为研究嵌合性非整倍体提供了很有前景的资源，因为其中可能包含有关细胞类型和染色体拷贝数的宝贵信息。此外，在单细胞数据中观察到的非整倍体特征还可能提示其起源于减数分裂或有丝分裂机制。既往研究已利用单细胞RNA测序（scRNA-seq）数据检测嵌合性非整倍体，确立了这一方法的原理可行性。

将该方法应用于来自74个胚胎的scRNA-seq数据（

一种基于互补特征在单细胞RNA测序数据中检测非整倍体的方法，这些特征包括染色体范围内的基因表达改变以及等位基因失衡。

在所有细胞类型和发育阶段中，我们估计80%（74个胚胎中的59个）至少包含一个非整倍体细胞，并且在74个胚胎中检测的全部1115个细胞中，有39%（1115个中的433个）在1%的FDR阈值下被判定为非整倍体（

在人类着床前胚胎的scRNA-seq数据中发现的非整倍体（

基于人类胚胎scRNA-seq数据检测到的染色体异常示例。每个热图代表一个独立胚胎的数据。热图的行代表单个细胞，列代表染色体（仅包括常染色体）。树状图展示了非整倍体特征的层次聚类，大致反映了非整倍体细胞之间的共同祖先关系。

每个胚胎中非整倍体细胞的比例呈现出典型的“U”形，提示减数分裂来源的非整倍体（例如，

尽管我们观察到染色体特异性非整倍体率与每条染色体上的蛋白编码基因数量之间存在负相关（Pearson’s r = −0.546，p = 8.64 × 10

着床前遗传学领域长期存在的问题包括：非整倍体细胞如何分布于不同细胞类型之间，以及这种分布如何在发育过程中发生变化。细胞类型特异的非整倍体易感性和/或耐受性，可能有助于解释诸如在后期发育阶段观察到的局限于胎盘的嵌合现象（

不同细胞类型间非整倍体的比较。

人类胚胎中对非整倍体的转录响应。

尽管scRNA-seq数据对于判定细胞类型具有信息价值，但其稀疏且爆发式的特性给非整倍体推断带来了挑战，从而在实际应用中限制了灵敏度和特异性（

利用该模型，我们鉴定出2925个在整倍体与非整倍体细胞之间差异表达的基因（5% FDR；表S2）。其中最显著的关联涉及该基因的上调

为了进一步深入理解人类胚胎对非整倍体的全局响应，我们对分子特征数据库（MSigDB）中的hallmark基因集进行了基因集富集分析。该分析揭示出20个基因集在差异表达基因分布的尾部显著富集（5% FDR）。值得注意的是，我们观察到在非整倍体细胞中显著富集上调基因的基因集较少（2个基因集），而显著富集下调基因的基因集较多（18个基因集）。下调的基因集包括与细胞增殖、蛋白质加工和代谢相关的基因集。

在非整倍体细胞中富集上调基因的基因集包括那些受KRAS信号通路下调的基因（这再次可能反映出一种抗增殖反应），以及响应TNF-α时由NF-κB调控的基因，这与此前在非整倍体细胞系中报道的细胞应激和炎症信号总体一致（

以往大多数关于人类着床前胚胎非整倍体的研究的一个关键局限在于，它们依赖于对一个或少数几个细胞的活检。许多研究采用了一种关于嵌合体的操作性定义，即基于PGT-A结果，其表现介于均一整倍体活检和均一非整倍体活检的预期结果之间（

我们试图通过利用已发表的人类解离胚胎scRNA-seq数据来克服这些局限。通过结合基因表达改变和等位基因失衡的特征，我们在单细胞分辨率下揭示了减数分裂性和有丝分裂性非整倍体的模式。共有31%的胚胎在所有细胞中至少有一条染色体表现出均一或近乎均一的非整倍体，这一模式可归因于减数分裂错误，而这类错误在很大程度上可追溯至母源卵子发生。与此同时，低水平嵌合现象在所有细胞类型和发育阶段中均较为普遍，推断有74%的胚胎至少包含一个受有丝分裂错误影响的细胞。

尽管这一估计值显著高于大多数基于活检的研究，但它与少数先前在解离胚胎单细胞中定量非整倍体的研究结果大致一致，尽管这些研究采用了不同的方法学或处于不同的发育阶段。一项里程碑式研究由

我们研究中的一个令人惊讶的观察是，发现了一个嵌合的近单倍体胚胎（胚胎E7.5），其中9个细胞中有8个似乎为单倍体或近单倍体，而另一个细胞则表现为近二倍体。这种极端形式的嵌合现象仅凭基因表达分析无法被检测到，但基于等位基因失衡特征则可清晰识别。已知葡萄胎约影响每600次妊娠中的1次，其中一半为三倍体双精受精型（两套父源染色体和一套母源染色体），另一半为二倍体雄核发育型（两套父源染色体）。据估计，后者中约85%为单精受精，可能通过母源染色体被排出至第一极体，随后父源染色体发生“二倍体化”而形成（

通过利用scRNA-seq数据中包含的细胞类型信息，我们还评估了一个长期存在的问题，即不同细胞类型之间的非整倍体率如何变化。从基础生物学和临床角度看，这一问题都具有吸引力。此类比较不仅有助于理解基因必需性和剂量敏感性的发育图景，也有助于阐明来源于滋养外胚层组织的PGT-A活检的代表性。我们未检测到非整倍体在滋养外胚层中的显著富集，但需注意，较宽的置信区间（AME = 0.012，95% CI [-0.064, 0.087]）表明我们不能排除存在适度差异。

事实上，在成熟小鼠囊胚的滋养外胚层细胞中观察到的约6%的非整倍体富集，由

已知非整倍体的转录后果并不限于直接的剂量效应，还会延伸至

这里所描述的一项关键方法学进展，是整合表达改变特征与等位基因失衡特征，以在单细胞中检测非整倍体。对等位基因失衡的考量增强了我们对结果的信心，尤其是在单体性情况下；单体性会在整条染色体范围内产生单等位基因表达（同时考虑到诸如条形码交换、伪阳性SNP以及错误比对读段等技术伪影）。尽管取得了这一进展，从scRNA-seq数据中推断非整倍体仍然具有挑战性。

一个重要的注意事项是，表达水平和等位基因平衡相对于二倍体预期的任何偏离，都可能导致我们拒绝原假设，而除整条染色体非整倍体之外的其他现象有时也可能诱发此类偏离。例如，大规模结构变异可能会被我们的方法误判为非整倍体。尽管我们所设定的效应量阈值有助于缓解这一问题，但明确区分片段性非整倍体与整染色体非整倍体的方法，仍是未来发展的重要方向。方法学进一步改进的其他机会还包括将基于群体的和/或基于读段的定相整合到等位基因失衡分析中，这对于三体性的推断可能尤其有益（

另一项需要指出的注意事项是，我们研究中分析的数据来源于相对较少患者的IVF胚胎，而关于这些患者的人口统计学或临床信息均未公开发表。因此，我们敦促读者在将这些发现外推到更广泛人群时保持谨慎。既往研究已经确立了母亲年龄与植入前胚胎减数分裂错误发生率之间的强相关性（

非整倍体是导致人类妊娠丢失和先天性出生缺陷的首要原因（

非整倍体推断基于染色体范围差异表达和等位基因失衡这两种互补特征。差异表达特征是软件包的基础

为了将观测到的等位基因失衡比率转换为z分数，我们首先通过回归消除了读段数量对等位基因失衡的影响，因为我们观察到，所观测比例与用于生成这些比例的读段数量之间存在正相关。随后，在假设大多数细胞-染色体组合都处于原假设之下的前提下，我们将所有原假设数据点界定为：其等位基因失衡估计值位于经验分布第一四分位数与第三四分位数之间的数据点。接着，我们将原假设比例处的残差估计为所有原假设数据点所生成残差的均值。为了估计原假设下的方差，我们进一步假设这些残差近似服从正态分布。

在这一假设下，并结合我们已假定大多数细胞-染色体组合处于原假设之下这一前提，我们使用下式推导了原假设下等位基因失衡残差的方差，

因此，对 σ 求解并将其平方后，我们得到上述结果。在零假设下获得均值和方差后，我们通过从每个点中减去该均值并除以方差的平方根，将残差转换为 z 分数。随后，基于单体性和三体性都会增加等位基因不平衡这一预期，我们计算了单侧 p 值。

我们利用上述 scploid 和等位基因不平衡分析所得的 p 值，对每个细胞-染色体进行了总体检验。我们注意到，作为最后一步，

我们使用混合效应逻辑回归评估了细胞类型对非整倍体状态的影响。我们拟合了两个模型。在这两个模型中，我们的结局变量均为指示非整倍体状态的二元变量（若细胞具有一条或多条非整倍体染色体，则定义为非整倍体），并纳入胚胎发育阶段（受精后天数）作为固定效应连续变量。在第一个模型中，我们纳入了细胞类型（分类变量）；在第二个模型中，我们纳入了滋养外胚层细胞的指示变量（其余所有细胞类型归为非滋养外胚层）。我们将胚胎视为随机效应，以解释同一胚胎内细胞之间的相关性，并对两个模型均估计了随机截距。

同时，假定各胚胎彼此独立。

针对非整倍体的全局转录反应，我们通过比较被判定为整倍体与非整倍体的细胞之间的差异表达进行了研究。单细胞表达计数采用以下方法进行标准化

作者声明不存在竞争性利益。

感谢马里兰高级研究计算中心的工作人员提供计算支持。同时感谢非整倍体起源研究联盟提出的重要反馈。感谢 Alexis Battle、Rong Li、Jin Zhu，以及 McCoy 实验室成员的有益讨论。本研究得到 NIH 资助项目 R35GM133747（资助对象为 R.C.M.）的支持。

📄 原文链接：https://www.biorxiv.org/content/10.1101/2020.01.06.894287

🏷️ 单细胞RNA测序胚胎发育非整倍体染色体嵌合拷贝数变异

在 WEC技术前瞻

# 单细胞RNA测序拷贝数变异染色体嵌合胚胎发育非整倍体

Administrator 2026年5月19日