美国国家科学院报告评估人工智能对生物安全的影响
3月,美国国家科学院发布报告《人工智能在生命科学中的时代:益处与生物安全考虑因素》[1],评估了人工智能在多大程度上可放大应用生物工具的益处或风险,并为美国提供了在生物技术中利用人工智能的方法,同时最大限度降低人工智能可能被滥用于开发有害生物制剂的风险。
1、人工智能驱动的生物设计与合成生物学风险。合成生物学的典型特征是构思,然后是设计-建造-测试-学习(DBTL)过程。人工智能生物工具带来的最显著能力提升是在构思和设计阶段,可以通过为实验验证提供数据驱动的指导、生成新的假设和想法以及利用大型数据集中发现模式来加速和优化研究设计和发现。该委员会评估了目前现有的人工智能生物工具是否能够用于3种类型的有害应用:
(1)实现生物分子的设计,如毒素。目前可用的人工智能生物工具能够使用不同的氨基酸构建块设计和重新设计毒素,但潜在威胁的规模可能仅限于地方层面,而不会上升到流行病或大流行层面。
(2)改造现有病原体,使其毒性更强。可用的人工智能生物工具可能能够模拟非常具体的特征,这些特征可预测与毒力相关的特征。然而,某些限制会影响模型性能,包括数据集不足和建模生物复杂性的挑战。
(3)设计一种全新的病毒。目前,没有可用的具有设计新型病毒能力的人工智能生物工具。此外,目前还不存在可用于训练此类模型的生物数据集。
未来人工智能技术的发展,包括科学基础的大型语言模型、自动化实验室改进及合成数据应用,或将进一步加速生物设计和发现。合成数据可填补实验数据空白,但需更多研究来克服模型坍塌等问题。
2、促进和保护人工智能创新以增强生物安全。人工智能生物工具可以通过加强预测、监测、预防和响应来改善生物安全,并减轻生物威胁。这包括改进生物监测和加速制定医疗对策,以应对故意的生物威胁和自然发生的传染病暴发。
(1)生物监测与预警。人工智能在生物监测与预警方面潜力显著。自然语言处理技术可提前识别SARS-CoV-2(严重急性呼吸系统综合征冠状病毒2型)感染病例,人工智能诊断算法能分析病原体基因序列区分病原体,人工智能平台结合流行病学数据可推断疾病传播事件,人工智能模型实时监测基因组数据可预测疫情模式,为公共卫生响应提供信息,还能指导治疗决策,支持公共卫生策略。
(2)医疗对策开发。人工智能在医疗对策开发中可发挥关键作用,在疫苗和生物制剂开发方面尤为突出。人工智能可加速疫苗设计,助力快速确定病毒结构设计有效疫苗;还用于开发单克隆抗体,快速生成与病毒抗原结构匹配的抗体设计,加速诊断和治疗手段开发,显著缩短从发现疫情到启动对策开发的时间,提升全球应对生物威胁的能力。
(3)生物设计安全性。人工智能虽可能被滥用于有害用途,但也可用于筛查和预防生物威胁的产生。报告建议对核酸合成筛选的新方法进行更多研究,包括如何利用人工智能生物工具进行筛选,以使该过程成为有效的控制点和降低潜在生物安全风险的可能策略。建议与人工智能生物工具从业者和开发者合作,探索实施方法,与生物学家和其他开发者合作,评估筛查对公共卫生准备和响应的影响。
3、优化数据资源和基础设施。生物数据是生命科学中新的人工智能应用出现的主要指标。然而,除了核酸序列和结构数据外,生命科学中的数据是碎片化的,可用于模型训练的稳健、可靠的数据很少。缺乏数据聚合阻碍了研究和开发,特别是在训练新的人工智能生物模型和能力方面。数据存储库的生成、管理和保存需要对实验室和计算基础设施能力以及主题专业知识进行大量的长期投资。报告认为,建设新的国家数据资源和战略性收集人工智能生物数据集是美国保持科学竞争力和创新的研究重点。报告建议:为公开的生物应用创建并管理与人工智能兼容的数据和训练集;发起和支持公私伙伴关系,以生成培训数据集;开发前沿人工智能生物工具,这些工具经过专门的生物数据培训,专注于生物能力;拥有或资助生物数据库的联邦研究机构应该为大规模的高质量、可公开访问的生物数据的标准化、管理、整合和持续维护提供强有力的激励和基础设施;国家人工智能研究资源(NAIRR)试点应探索建立用于训练人工智能模型的中央存储库的方法。
(郑颖)
[1] The Age of AI in the Life Sciences: Benefits and Biosecurity Considerations (2025). https://nap.nationalacademies.org/catalog/28868/the-age-of-ai-in-the-life-sciences-benefits-and