结合实验与数值方法设计用于莱姆病诊断的DNA适配体

适配体是单链 DNA 或 RNA 分子,因其对靶分子具有高亲和力和高特异性结合能力而被筛选出来,其性质类似于抗体。它们通常通过 SELEX 过程进行筛选,该过程包括将随机序列文库反复暴露于靶标,并保留表现出良好结合特性的序列。为了改进莱姆病的检测,我们提出设计能够特异性结合伯氏疏螺旋体(Borrelia burgdorferi)表面 CspZ 蛋白的适配体,该细菌是引发该疾病的病原体。 从包含十...
生物信息学

适配体是单链 DNA 或 RNA 分子,因其对靶分子具有高亲和力和高特异性结合能力而被筛选出来,其性质类似于抗体。它们通常通过 SELEX 过程进行筛选,该过程包括将随机序列文库反复暴露于靶标,并保留表现出良好结合特性的序列。为了改进莱姆病的检测,我们提出设计能够特异性结合伯氏疏螺旋体(Borrelia burgdorferi)表面 CspZ 蛋白的适配体,该细菌是引发该疾病的病原体。

从包含十三轮筛选的 SELEX 过程出发,已从中获得若干体外筛选的候选序列,我们旨在提出一种整体性流程,在计算机模拟环境中筛选新的候选序列,并进一步通过实验进行验证。

我们的方法依赖于: 1)使用机器学习(ML)技术,特别是受限玻尔兹曼机(RBM),对 SELEX 过程的最后一轮进行数字化复现; 2)将文本分析方法中的见解,例如 word2vec 和 n-gram,整合到基于最终轮 SELEX 数据集训练的 RBM 模型中,以表征并比较新生成序列与体外候选序列; 3)筛选在计算机模拟中具有较强潜力与 CspZ 蛋白结合的序列; 4)对步骤 3 中筛选出的计算机模拟序列进行实验验证。

我们的整体性方法将生物学见解与统计模型相结合,以提高 SELEX 过程的效率和结果。我们通过整合序列的几何表征来增强用于复现最终 SELEX 轮次分布的 RBM 模型,这在面对相对于巨大序列空间而言较为有限的数据集时尤其具有优势。此外,该方法还能提供具有较强结合特性的计算机模拟候选序列。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.13.724892v1?rss=1

🏷️ DNA适配体 SELEX筛选 莱姆病诊断 机器学习 伯氏疏螺旋体 CspZ蛋白

Administrator 2026年5月17日
我们的博客
存档