一种改进的通用模式,用于复杂多检测医学昆虫学研究中高保真数据关联与样本追踪

基于证据的疟疾媒介控制策略决策日益依赖于数据三角互证,这要求信息学系统能够整合涉及蚊虫的复杂、多阶段研究数据。本文描述了对支撑 VBDs360 平台的通用模式扩展版本的性能评估,该版本经过专门改进,以容纳涵盖野外、昆虫饲养室和实验室的多种不同昆虫学检测。通过在坦桑尼亚南部开展的一项案例研究,评估了该扩展在复杂昆虫学工作流程中实现高保真数据关联和稳健样本可追溯性方面的效用。研究人员从超过 4,000...
生物信息学

基于证据的疟疾媒介控制策略决策日益依赖于数据三角互证,这要求信息学系统能够整合涉及蚊虫的复杂、多阶段研究数据。本文描述了对支撑 VBDs360 平台的通用模式扩展版本的性能评估,该版本经过专门改进,以容纳涵盖野外、昆虫饲养室和实验室的多种不同昆虫学检测。通过在坦桑尼亚南部开展的一项案例研究,评估了该扩展在复杂昆虫学工作流程中实现高保真数据关联和稳健样本可追溯性方面的效用。

研究人员从超过 4,000 平方公里范围内的 40 个地点采集野生雌蚊,随后在昆虫饲养室中连续繁育多代,再对其衍生的同母系谱进行拟除虫菊酯类杀虫剂表型敏感性检测。此类多代系谱(F0 至 Fn;其中 n 大于或等于 2)之所以被扩繁,是为了避免不可遗传的母源效应对表型的影响,并产生足够数量的后代用于标准 WHO 敏感性测定。随后,所有样本均存档于分子实验室,并对所有 F0 标本进行了同胞种身份鉴定。

扩展模式的纸质化实施成功整合了 77,017 条数据记录,这些数据分布于 6 个不同的数据表中,覆盖 3 个不同的野外、昆虫饲养室和实验室工作流程,并由位于不同地点的 3 个不同团队执行。在每一个步骤中,完全独立且冗余的主键和次键实现了高保真的错误校正和样本追踪。对于 F0 野外捕获成蚊,检测设计与样本分拣数据之间实现了始终完全一致的关联,在野外捕获与形态学分类之间,66,108 条记录中有 100% 成功关联。

这种完整的可追溯性也延伸至衍生 Fn 系谱的繁育过程,其中来自 9 条成蚊来源系谱和 13 条幼虫来源系谱的全部 100 条和 243 条记录均实现了正确关联。杀虫剂敏感性表型进一步证实,在昆虫饲养室中,暴露史与记录的死亡结局数据之间的 5,654 条记录实现了 100% 关联。尽管与实验室团队记录的样本分析和存储数据相关的这种交叉清洗关联并非完全无误,且仍有改进空间,但其保真度仍然很高(F0 样本为 97.3%(1967/2,022),Fn 样本为 99.3%(437/440))。

总体而言,这一扩展通用模式的试点应用确保了这一由多个团队、跨多个地点开展的复杂研究中的稳健数据溯源,并最大限度减少了转录错误。这些发现表明,该通用信息学框架可进一步扩展和适配,以支持多样化、大规模、多团队昆虫学研究工作流程中的数据完整性。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.11.724183v1?rss=1

🏷️ 医学昆虫学 数据关联 样本追踪 疟疾媒介 信息学平台

Administrator 2026年5月14日
Archive