英国发布人工智能赋能科学战略

作者: 2026-02-02 15:10 来源:
放大 缩小

20251120日,英国科学、创新与技术部(DSIT)发布《人工智能赋能科学战略》[1]。该战略预计配套投资为1.37亿英镑(约合12.9亿元人民币),以数据、计算、人才与文化三大支柱为核心抓手,提出了人工智能赋能科学研究的15项行动。

该战略包括两个目标,一是发展人工智能赋能科学的前沿能力,二是确保英国的全球科学领导地位。该战略还与《英国现代产业战略》紧密相连,将促进代表八大产业战略部门前沿产业和技术的5个优先领域的发展,即先进材料、核聚变、医学研究、工程生物学和量子技术。

1、人工智能驱动的科学研究。人工智能自动化科学发现的前景具有颠覆性,即使在有限的情况下,也已深刻挑战了当前许多研究实践,而且距离也只有几步之遥。

行动1:加速英国人工智能驱动的科学的发展。英国将支持已经迅速行动、在自主实验室与人工智能驱动科学发展方面走在前列的科研团队:主权人工智能单元DSIT为发展人工智能设立的部门)将对自主实验室发起公开征集,着眼于数据生成和人工智能驱动发现两方面;将与面向科研知识创建全流程构建人工智能系统的团队合作,共同制定在英国科研生态中安全部署此类系统的框架,这包括通过高级研究与发明署(ARIA)发起的探索性项目人工智能科学家开展合作;政府将探索可行的使用与访问模式,使英国科研生态能够以安全、透明的方式使用通用型人工智能科学工具。

行动2:在英国元科学单元工作的基础上,资助研究人工智能融入科学研究的方法论影响。英国国家科研与创新署(UKRI)与DSIT共同设立的英国元科学单元UK Metascience Unit)将持续推进人们理解采用人工智能对科研版图的改变,以及政府、产业界和资助机构的应对措施,该部门已资助18位职业早期学者研究人工智能如何改变科学实践,研究主题包括人工智能在同行评议、证据综合和合成数据生成中的应用,以及这些变化如何影响科研人员的生产力、创造力和身心健康;在此基础上,该单元还将开展一次全面的国家科研中人工智能使用调查,以更深入地了解人工智能在不同学科领域和职业阶段的科研活动各环节中是如何渗透与被采纳的。

2、支柱1:数据。数据是人工智能驱动科学突破的关键要素,需要采取有目的且有针对性的方法来生成高质量的新数据集并优化现有数据。

行动3UKRI将制定一项指令,扩大其拥有的设施、实验室和研究所的实验运行数据和模拟数据的存储规模,确保到2030年,所有实验的相关和有用数据都能得到存储、整理,并符合可发现、可访问、可交互、可重用(FAIR)原则。DSITUKRI将支持英国领先的国家实验室和科学设施,生成人工智能就绪数据并率先采用人工智能优先的方法;UKRI将继续推进其研究数据政策的现代化,并与科学界合作,确保其资助的研究产生的数据符合FAIR原则,同时支持一个现代化的、人工智能就绪的数据环境,包括探索使用人工智能工具帮助研究人员创建和优化数据;UKRI计划于2026年发布修订的数据政策,即将出台的UKRI人工智能战略将阐述人工智能优先方法的细节,并制定关键目标和具体行动,以推动人工智能就绪数据的规范化和标准化发展。

行动4:识别并开发高价值数据集,以解锁科学优先领域的变革性突破。DSIT将开发高价值数据集,与文艺复兴慈善基金会(Renaissance Philanthropy)合作发起数据集提案的征集和评审,与亨利·罗伊斯研究所合作推动整理和集中管理高质量人工智能材料数据,建立标准化元数据和应用程序编程接口的原型存储库;后续行动将通过结构化的发现流程,采取积极的社区主导方式,识别高价值数据集,并利用外部合作、公开征集、研讨会和黑客马拉松等活动,识别科学家所需的数据集,其关键优先事项之一是为英国创建新的数据资产。

行动5:启动收集暗数据的试点项目,包括负面实验数据,以提升英国优先领域的模型性能。科学数据领域存在着海量的暗数据,包括未发表的实验结果、实验设置的详细信息、大型机构持有的非机器可读数据以及负面实验结果。目前,发布负面数据的机制和激励措施仍然有限,未能体现此类数据对机器学习的独特价值。UKRI将与大型数据机构合作,启动3~5个试点项目,采用创新方法收集目前在大型数据集中代表性不足的数据,例如负面数据或实验设置细节。DSITUKRI还将与行业合作伙伴接洽,寻求就研究人员访问私有负面数据达成协议。

行动6:建设大规模数据基础设施,在自主计算资源附近存储高价值数据集。政府将在布里斯托尔超级计算中心(BriCS)建立一个新的数据存储库,与人工智能超级计算机Isambard-AI共址,并将投资扩建爱丁堡并行计算中心(EPCC)的存储容量;政府将开发安全的智能体间交互机制,以管理联邦系统内的数据访问,确保为用户提供最好的工具;新的人工智能研究资源(AIRR)项目的数据能力将探索如何在强有力的隐私保护措施下,通过AIRR提供对高影响力健康数据集的安全访问,从而使英国科学家能够利用这些数据开展更具雄心的人工智能研究。

3、支柱2:计算。计算是人工智能发展的引擎。英国投资10亿英镑(约合94.4亿元人民币)扩展AIRR,发展世界级的人工智能计算生态系统。Isambard AI20257月正式推出后,已成为世界上功能最强大的超级计算机之一,与剑桥的曙光超级计算机一起,共获得3亿英镑投资。该支柱的行动包括两方面:开发硬件、软件、工作流程和人力基础设施,以实现计算访问;创建有针对性的分配路径,使该计算资源以足够规模提供给研究人员。

行动7:启动AIRR征集,旨在加速英国优先领域中的人工智能驱动的科学突破。2025年秋季开始,DSITUKRI将通过AIRR提供计算资源,支持人工智能驱动科学优先领域的研究。这将基于现有的资源访问途径,支持各类规模的研究:在最小规模需求方面,研究人员希望在其科学研究中应用人工智能,可以通过AIRR门户途径申请支持,该途径提供1万个GPU小时(为期3个月),用于访问Isambard-AI和曙光超级计算机的计算资源;在主权人工智能单元20257月成功启动人工智能赋能科学试点征集的基础上,将面向优先领域启动更广泛的研究征集,将在6个月内提供20~100万个GPU小时的资源,支持在5个优先领域中进行变革性的人工智能驱动研究;还将启动一个征集,提供系统接管访问权限,专门用于以任务为导向的项目,将提供最多140万个GPU小时(为期两周),首次将聚焦快速药物开发任务;随着未来任务的启动,将进一步开放大型计算资源访问的多轮迭代征集,进展将在每12个月进行审查,以跟踪任务目标的对接情况和实施方法的有效性。

行动8:开发一个横跨英国科研密集生态系统的计算集群联邦网络,与行业和学术界合作生成高质量的模拟数据集。DSITUKRI将与英国的科研密集型机构以及英国国家研究与教育网络(Jisc)合作,探索建立一个系统的可行性,该系统能协调Jisc内闲置的计算时间和计算能力;JiscJANET网络为该系统提供底层基础设施,并有望利用该网络开发一个提高计算基础设施效率的系统,DSITUKRI将在2026年探索项目开发和潜在的试点项目;DSITUKRI将召集来自行业和学术界的合作伙伴,探索大规模数据生成和研究机遇。

4、支柱3:人才与文化。人工智能人才的深度是生态系统繁荣的基础。人工智能融入科学需要新型的研究团队、组织结构和协作模式,英国的目标是打造一个丰富的生态系统,能够培养一流的科学家和技术专家,促进研究界内基于团队的大规模科学,建立跨学术界和行业的深度连接以支持成果转化和创业,使英国成为全世界优秀研究人员的灯塔。共包括6项行动。

行动9:在未来5年内扩大人工智能赋能科学方向的博士培养规模,目标是启动至少1000名研究人员的培养,使其熟练掌握人工智能与学科知识,或在研究中应用人工智能。

行动10:通过跨学科研究员项目,为领军科学研究人员赋予人工智能能力,并从社区内部推动能力提升。

行动11:打造多元化培训项目,为各学科、各职业阶段的研究人员和技术专家提供能力提升。

行动12:组建跨学科科研团队,推动英国优先领域中人工智能赋能的科学突破。

行动13:面向各类科研技术专业人员加大投入,并协调高校与科研机构共同制定技术岗位职业发展路径。

行动14:支持由科研共同体主导的基准测试与评估,通过共享的模型性能评估推动人工智能赋能科学关键问题的进展。

5、任务。人工智能赋能科学的任务是特定、有时限的目标,只有通过人工智能实现突破性的科学进步才能实现。各项任务将分阶段启动。以下发布的是任务一,后续任务将于2026年遴选确定。

任务一:英国将加快药物研发速度,力争在2030年前实现100天内开发出可用于临床试验的药物,从而更快地推广新疗法。

行动计划:实现任务一,需要对临床前药物研发流程的多个阶段采取干预措施。整体推进将围绕三大支柱——数据、计算以及人才与文化——以及人工智能驱动科学方面同步发力,以完成这一任务。

1)人工智能科学智能体。努力确保相关科研共同体能够安全部署最前沿的人工智能科学智能体,从而变革靶点发现过程。这些人工智能工具可以从海量科学文献和组学、遗传学和健康数据集中挖掘出任何个人都无法全面浏览的信息,并快速生成关于潜在靶点的假设。

2)高质量数据集。致力于显著提升结合亲和力的可预测性,帮助科学家选择和设计疗效更好、脱靶效应更少的药物。DSIT已向钻石光源的OpenBind联盟投资800万英镑。该联盟使用突破性的实验技术,构建了全球规模最大、元数据丰富的药物-蛋白质相互作用数据集,从而推动用于预测药物结合和早期药物设计的高质量人工智能模型的开发。

3)可开发性模型。将探索改进可开发性模型的方法,包括免疫原性模型以及吸收、分布、代谢、排泄和毒性(ADMET)模型,以加速先导化合物优化和临床前测试。当前正在推进的、旨在减少药物研发过程中动物试验的工作,为进一步拓展机遇提供了重要基础。其中一项举措是,投资3000万英镑建立新的临床前转化研究中心,用于整合数据、细胞工程、基因组技术和相关专业能力,开发新的体外和体内模型。

4)算力与资金支持。英国将通过AIRR为科研团队提供资金和大规模计算资源,用于在上述机遇领域开展人工智能研发,包括开发更精确的结合预测、免疫原性和ADMET模型。

5)下一代技术与平台。英国将寻找机会,发现可快速应用于新发和意外疾病的下一代技术与可编程平台。这些技术有可能在未来的大流行中发挥关键作用,与mRNA技术在应对COVID-19疫情中发挥的作用一样。为此,需要开展跨学科研究,把人工智能专业知识与英国在多个科学和生物技术方向上的优势结合起来。

6)协调与合作。英国将通过AIRR为科研团队提供资金和大规模计算资源,用于在这些机会领域开展人工智能研发。英国将努力弥合关键数据缺口,以推动在这些方向上取得突破性进展。

7)支撑与服务。新的健康数据研究服务(HDRS)将为上述干预措施以及药物发现中的其他关键进展提供支撑。在英国政府和惠康信托基金会最高达6亿英镑的投资支持下,HDRS将为多源的大规模健康数据资源提供统一入口。这些关联的、可用于人工智能的病理学、放射学和基因组数据集,为人工智能模型的开发和验证奠定了基础,可用于识别生物标志物、促进疾病建模,并创建临床前模型,从而提高对人体对干预措施反应的预测能力。HDRS也将支持临床试验优化,使人工智能能够用于简化试验设计和入组条件评估,加快临床试验实施进度。

行动15:遴选若干人工智能赋能科学的新任务,于2026年启动。DSITUKRI将牵头根据该战略的目标遴选其他任务。   

   (边文越)



[1] AI for Science Strategy. https://www.gov.uk/government/publications/ai-for-science-strategy/ai-for-science-strategy


附件: