生物学先验神经网络(biologically informed neural networks, BINNs),也称为可见神经网络(visible neural networks, VNNs),因其架构能够映射已知的生物学结构(如基因到通路的关系),而在组学研究中被广泛采用,因此常被认为天然具有可解释性。这一假设意味着,所学习到的基因到通路的权重以及通路节点的激活能够反映有意义的生物学机制。在此,我们表明,这一前提由于一个经典原因而失效:不可辨识性。
通过采用一个受控的教师—学生框架,我们证明,即使在理想条件下——包括无噪声数据、正确的模型类别以及完全相同的稀疏连接结构——BINN 也能够完美恢复输入到输出的映射,同时却无法恢复基因到通路的权重和通路激活。这种失效在分类、回归和生存分析任务中均持续存在,并且对于生物学结构和网络深度的变化具有稳健性。因此,问题并不仅仅在于参数过多或优化不佳:仅从输出中学习并不能识别内部结构。由于生物学机制并不能被直接观测,仅凭预测结果恢复这些机制,比恢复神经网络参数本身更为困难,而后者早已被认为是不可辨识的。
关键在于,这种失效恰恰反映了标准实践:被广泛使用的 BINN 并未对基因到通路的权重或通路激活施加客观层面的约束,因此它们恰恰运行在我们教师—学生框架所建模的状态中。这些结果表明,架构上的透明性并不意味着机制上的可解释性。若不施加能够显式保证可辨识性的约束,BINN 表面上的可解释性所反映的只是其设计,而非其实际学到的内容。
感谢您有兴趣帮助传播 bioRxiv 的相关内容。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.07.723544v1?rss=1
🏷️ 生物学先验神经网络 可解释性 不可辨识性 组学分析 教师-学生框架 生物信息学