美科学院发布《自动化研究工作流程加速科学发现》报告
5月,美国国家科学院(NAS)发布《自动化研究工作流程加速科学发现——闭合知识发现回路》研究报告[1],指出自动化研究工作流程是集成了计算、自动化、人工智能的新兴的科学研究过程,不仅能加快科学发现,还可以加强对研究过程的控制和提高可重复性。
一、报告关于自动化研究工作流程的五个观点
观点1、自动化研究工作流程已在多个学科证明了其大幅提高研究速度和研究效率的潜力。一旦实现自动化研究工作流程规模化应用,就能够将研究发现的速度提高几个数量级,增大科研对社会的贡献。
观点2、自动化研究工作流程可以提高研究过程的透明度和可重复性。采用通用研究工具和平台,可以增加国际间和跨学科的合作。工作流程和结果的广泛可获得和可纠错,增强了社会对研究成果的信心并减少重复性工作。
观点3、实现自动化研究工作流程需要对现有的科研机制进行调整。包括为发展必要的硬件、软件和人力资源提供可持续的资助,培养科技劳动力,建立研究成果的报告和分享机制,建立相应的研究人员奖励和激励机制。多学科、多角色的合作对于实现自动化研究工作流程至关重要。
观点4、除自动化研究工作流程自身存在的障碍外,法律和政策层面也存在实施障碍,需要国际社会共同解决。
观点5、资助机构、科研人员、出版商等应与政府、数据隐私专家等合作,共同致力于解决应用自动研究工作流程中遇到的涉及隐私的法律、政策和技术障碍,探索保护隐私的算法。
二、报告的4点建议
建议1、发展自动化研究工作流程应遵循促进开放、可重复、透明原则。在使用人工智能和机器学习时,应纳入负责任原则,以减轻各种人为和技术缺陷带来的风险。自动化研究工作流程中使用的对象(数据、代码、整个流程等)应遵循可发现、可获取、可互操作、可重用原则。自动化研究工作流程应优先考虑现有工具和系统的再利用和可持续性,以减少昂贵的重复工作。自动化研究工作流程的关键基础设施应由研究群体管理,并可供其使用。
建议2、资助机构、专业学会、科研机构、出版商等应把确保自动化研究工作流程所需的关键系统、工具、平台、数据库的建立和可持续性放到更加重要的优先位置。为建立和维护可持续的基础设施,应支持跨学科的知识共享。通过资助数字基础设施,最大化发挥自动化研究工作流程的创新潜力和数据及其他研究产出的再利用。支持开放数据标准和科学仪器开放界面。通过建立和维护存储库,支持数据和软件资源及其更新版本的再利用、可复制和长期共享。出版商更新数据共享要求,将论文关联数据存储入库。
建议3、资助机构、高校、科研机构、专业学会应培养研发和使用自动化研究工作流程所需的劳动力,支持他们的职业发展。设立可以融合专业知识、数据科学、软件工程的项目。设立在所有科研领域培养数据素养和计算分析技能的项目。培养研发、运行、维护自动化研究工作流程硬件和软件所需的人力资源。促进旨在研发和使用自动化研究工作流程的合作研究,促进以尊重和保护隐私的方式共享工作流程、代码、数据。
建议4、资助机构、科研机构和专业学会应通过激励、奖励机制,创造一种有利于自动化研究工作流程发展的文化。激励、奖励行为应包括:团队合作;发展高质量的数据资源;开发、改进和共享软件资源;报告可重复的结果;帮助他人应用自动化研究工作流程;通过国际合作加快上述工作。 (边文越)
[1] Automated Research Workflows For Accelerated Discovery: Closing the Knowledge Discovery Loop. https://nap.nationalacademies.org/catalog/26532/automated-research-workflows-for-accelerated-discovery-closing-the-knowledge-discovery