关系生物结构提高了弱信号下因果GWAS变异的精细定位能力

连锁不平衡(LD)使因果 GWAS 变异与其相关邻近变异难以区分;对它们进行解析即为精细定位(fine-mapping)问题,而这一挑战具有物种特异性:人类面临密集且祖源失衡的 LD,酵母和 *Arabidopsis* 具有异常长的 LD,而作物种质资源则存在稀疏且碎片化的注释,难以适配人类生物样本库的整理流程。贝叶斯精细定位方法将注释作为每个变异的平坦先验加以整合,从而忽略了将变异与组织特异性 ...
生物信息学

连锁不平衡(LD)使因果 GWAS 变异与其相关邻近变异难以区分;对它们进行解析即为精细定位(fine-mapping)问题,而这一挑战具有物种特异性:人类面临密集且祖源失衡的 LD,酵母和 *Arabidopsis* 具有异常长的 LD,而作物种质资源则存在稀疏且碎片化的注释,难以适配人类生物样本库的整理流程。贝叶斯精细定位方法将注释作为每个变异的平坦先验加以整合,从而忽略了将变异与组织特异性 eQTL、通路及蛋白-蛋白相互作用联系起来的关系结构。

基于变异-基因-通路因子图的分层信念传播(HBP)在速度上比贝叶斯基线快 5–40 倍,同时保持相当性能;一种注释自适应补充方法——图增强精细定位(GAFM)——在弱信号条件下以 27–2 的优势胜过 SuSiE,并在四种 Pan-UK Biobank 祖源中以单变异分辨率恢复了 *LDLR*、*APOE*、*LPL*、*GCKR* 和 *ANGPTL3*。

在 3,000 Rice Genomes 的籽粒重量与形状数据集中,GAFM/HBP 及其集成模型(GAFM-MX、HBP-MX、ENS)的混合先验后验重加权在 21 个与面板匹配的稳定 QTN 中实现了 47.6% 的 top-1-PIP 精确位置恢复率——为所有方法中最高,超过 SuSiE(28.6%)和 SBayesRC(14.3%)——且每个位点速度为 SuSiE 的 200–700 倍。

在四个物种的 692 个领先信号中,起作用的不是均一的高覆盖,而是非均一的逐变异先验,使图结构能够打破 LD 平局:在 321 个 Pan-UKB 领先信号上,向原本均一的人类缓存中添加一个调控元件标记,使 HBP(比 GAFM 更窄)从 0% 提升至 88%。这些结果将多组学精细定位重塑为非均一先验整理问题,而非均一覆盖问题,并将 GWAS 后分析重新定义为在生物结构上的消息传递,而非对平坦化注释进行加权回归。

作者声明不存在任何竞争性利益。

注:仅请求您的电子邮件地址用于识别您为本文的发送者。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.15.725513v1?rss=1

🏷️ GWAS精细定位 连锁不平衡 因果变异识别 因子图模型 贝叶斯方法 生物网络整合

Administrator May 16, 2026
Archive