OECD报告分析人工智能对科研的影响及需采取的措施
6月,经济合作与发展组织(OECD)发布《科学中的人工智能与未来的科学研究》报告[1]指出,在人工智能的所有应用中促进科研生产力可能是最具经济和社会价值的。尽管人工智能正在渗透科学的所有领域和阶段,但其全部潜力还远未显现。报告提出为扩大人工智能对科研的积极贡献,科技政策制定者和行动者可以为加速和深化人工智能在科学中的应用采取以下措施。
一、通过多学科方案促进科技进步
需要广泛的多学科计划,将计算机科学家与工程师、统计学家、数学家等聚集在一起,利用人工智能解决挑战。需要有政府的专项资金来鼓励广泛的合作,而不是单独为各个学科提供资金。一个优先事项是促进机器人专家和领域专家的互动。实验室机器人可以彻底改变某些科学领域,降低成本,大大加快实验速度。具体包括:
1、政府鼓励和支持具有长期影响的富有远见的行动。如诺贝尔图灵挑战赛(Nobel Turing Challenge)等旨在建立能够进行世界级研究的自主系统的计划,可以激发科学领域的合作与协调,帮助集中精力应对全球挑战,推动在标准方面达成一致,并吸引年轻科学家参与。
2、增加对高性能计算(HPC)和软件的访问,促进支持科学的人工智能的进步。大型科技公司提供的计算资源是有帮助的,但使用商业云提供商提供的最先进的HPC/AI计算资源过于昂贵,资金不足的研究小组可能会因此受到影响。因此,国家实验室及其计算基础设施可以与工业界和学术界合作来弥补差距。处于该领域前沿的国家,包括美国和欧盟的领先国家,可以开展政策框架上的合作,从共享资源库中提供资源。
3、更新教育培训内容。如使用已经被证实的人工智能技术,教授学生如何在现有的科学文献中寻找新的假设。在人工智能的帮助下,基于知识综合的新的综合博士课程或产业研究课程可能有所帮助。
4、采取措施增加开放研究数据的可用性,并利用从健康到气候等各个领域的数据力量。如欧洲的健康数据空间和旨在为欧洲建立联邦数据基础设施的GAIA-X,可以帮助研究中心采用联合学习等系统,在不损害隐私的情况下将人工智能应用于多方持有的敏感数据。通过标准化接口使实验室仪器更具互操作性存在挑战,政府可以将实验室用户、仪器供应商和技术开发人员聚集在一起,支持实现互操作目标。
二、通过公共研发促进人工智能在科学中的应用
1、针对需要突破的研究领域,深化人工智能在科学和工程中的应用。研究方向包括:超越当前基于大型数据集和高性能计算的模型,找到自动化创建大规模可发现、可访问、可交互和可重用(FAIR)数据的方法;推进机器学习模型自动设计AutoML,以帮助解决人工智能专业知识的稀缺性和高成本问题,可以资助将AutoML应用于人工智能驱动的科学研究。支持开发开放平台(如OpenML),以跟踪人工智能模型可以解决的各种问题。
2、帮助培养新的、跨学科的蓝天思维。可以利用多源信息知识库,通过绘制不同概念之间的联系来组织知识。
3、支持建立对服务于科学的人工智能至关重要的知识库。可以致力于创建开放的知识网络,作为整个人工智能研究社区的资源。通过少量的公共资金帮助将人工智能科学家、来自多个领域和专业协会的科学家与志愿者聚集在一起,为人工智能利用和交流专业知识奠定基础。人工智能研究越来越多地受到大型科技公司中占主导地位的计算和数据密集型方法的驱动,因此需通过公共研发支持该领域的多样化,扩大人才库,需特别关注那些探索独立于主流深度学习范式的新技术和方法的项目,并支持研究以检查和量化人工智能研究范围缩小所带来的技术韧性、创造力和包容性的损失,以及产业界在人工智能研究中日益占主导地位的可能影响。
4、帮助开发专门的工具。增强人类-人工智能团队的协作能力,并将这些工具融入主流科学等。
三、优化科研治理
1、应系统评估人工智能对日常科学实践的影响。包括对人类-人工智能团队、工作、职业轨迹和培训的影响。项目资助招标可能需要进行此类评估,资助者和政策制定者应建立应对机制。
2、建立并支持新的独立论坛,就科学工作性质的不断变化及其对研究生产力和文化的影响开展持续对话。如ChatGPT等大型语言模型(LLM)的部署需要政策制定者的关注,因为其后果目前尚不确定。LLM可能会使科研工作变得更容易,模糊作者和所有权的概念等;LLM和其他形式的人工智能也可以助力治理过程,如支持同行评审,但需要更多的研究和测试来论证可能性。
3、解决人工智能药物发现双重使用所带来的潜在危险。人们很少关注能够自动设计、测试和制造极致命分子的迫在眉睫的危险,包括其它两用研究。政策制定者和研究系统中的其他行为者需要评估哪种可能的治理安排最能保护公共利益。
4、政策制定者需要更多的专业知识来决定采取哪些支持性技术举措。现有的社交网络和平台可以用来帮助传播新出现的做法。Academia.edu和Loop社区等社交平台可以用作试验台,试验人类-人工智能知识发现、想法生成和合成,以及传播和发展基于文献的发现等方法。同样需要采取措施来提高人工智能研究的再现性。公共资助机构可以要求与第三方自由共享代码、数据和元数据,使他们能够在自己的硬件上进行实验。
5、撒哈拉以南非洲及其他发展中地区需获得更多的科学人工智能资金。开展合作可以帮助各国推进开放科学,制定数据保护立法,改善数字基础设施,加强人工智能的准备,并支持非洲自己的新兴举措,包括数据、软件和技术的本土开发。 (王建芳)
[1] Artificial intelligence in science and the future of research. https://newsletter.oecd.org/q/1134JmiOUUsGlLilb1b/wv