美国华盛顿州立大学研究人员开发出一种预测细菌耐药性基因的新方法,通过机器学习和博弈论模型,他们能以93%—99%的准确率,预测3种不同类型革兰氏阴性菌中耐药基因的存在。
细菌对抗菌素的耐药性已成为影响全球公共健康的重要问题,威胁着亿万人群,仅美国每年就有数百万人会被耐药细菌感染,导致成千上万人死亡。近年来,科学家一直在努力寻找预测、识别抗菌素耐药性基因的手段,以求更有效地对病患施药。随着全基因组测序技术的突破,他们开发出序列比对方法,通过序列相似性来鉴定抗菌素耐药性基因,但遇到与已知抗菌素耐药性基因具有高度相似性的序列时,这些方法则有些无能为力。
此次,华盛顿州立大学研究团队决定使用博弈论来帮助预测、识别抗菌素耐药性基因。博弈论是一种研究具有斗争或竞争现象的数学理论和方法,是当前经济学的标准分析工具之一。在博弈模型中,一个参与者的行为会影响并取决于其他参与者的行为。
研究团队使用其开发的机器学习算法和博弈论模型,不仅对细菌基因组中简单的序列相似性进行分析,还深入研究了蛋白质序列结构、理化特征、进化特征、组成特征等多个特征的相互作用,以求准确预测抗菌素耐药性基因。他们在9日的《科学报告》上发表研究论文称,使用新方法预测3种革兰氏阴性菌——假单胞菌、弧菌和肠杆菌的抗菌素耐药性基因序列,其准确度达到93%—99%。
研究人员表示,这种新颖的博弈论方法特别强大,其将基因特征的相关性和相互依赖性综合考虑,根据它们在整体上协同工作的能力来识别可能的抗菌素耐药性基因,因而能够鉴定出以前通过简单序列比对方法无法识别的推定抗性基因。随着抗菌素耐药性的增长和现有测序基因组数量的增加,迫切需要开发新的、更准确的耐药基因预测、识别工具,而他们的研究表明,机器学习模型将是一个重要研发方向。(记者刘海英)
总编辑圈点
如果不能加以控制,抗菌素耐药性每年导致死亡的人数,甚至可能会高于因癌症去世的人数。因此科学家们才投入巨大的人力物力去识别抗菌素耐药性基因。但人类不是“超体”,大脑无法处理大规模数据集,这太复杂也太耗费时间。而机器学习却完全可以胜任这样的工作,瞬时理清大量信息之间的关系。现在,用博弈模型和机器学习联手处理生物数据,无疑将识别的准确度和速度成倍提高,为人们应对这一巨大公共卫生问题,提供了强有力的支撑。