国际科学组织联合提出开放数据的基本原则
2015年12月18日,国际科学理事会(ICSU)、国际科学院联合会(IAP)、世界科学院(TWAS)和国际社会科学理事会(ISSC)联合发布了《大数据环境下开放数据的协议》[1],指出数据革命为全球科技带来了机遇和挑战,并提出了开放数据需遵循的基本原则。
一、数据革命带来的机遇
丰富的数据为科学研究带来的机遇包括:新模式的发现;关联系统的不同方面从而更好地理解它们的行为;描述复杂性的特征;深刻理解复杂系统的不同状态,模拟并预测其动态行为。许多研究领域都需要这方面的能力,如天气和气候预测、大脑工作机理探索、全球经济行为研究、农业生产力评估、人口预测、历史问题研究以及环境变化、传染病、大规模迁移等全球性问题的研究。
二、数据革命带来的挑战
1、开放数据势在必行。在数字化革命背景下,数据和思想快速传播促进了科学创造力的提升。公共资助的研究项目数据应能够公开获取和再利用,以推动科学领域的数据革命和科学技术的快速发展。
2、数据开放支持可重复验证。近期,许多学科领域学术论文研究结论有很大比例不可验证的问题说明开放数据的重要性。科学论文出版的同时,相关的数据、元数据以及计算机代码的公开有助于其他人员对研究结论进行及时审查和验证。同时,数据应智能开放,即可发现、可获取、可理解、可评价和可再利用。
3、大规模支持数据发现。传统的统计方法无法从大规模、大范围和关联的数据中挖掘出复杂的关系,因而需要更深入的数学方法(如拓扑方法等)从大数据得到有效的推论。数据密集的机器分析和机器学习对科学发现具有重要的意义,但人类通常难以理解机器识别的复杂模式,因此人机交互是需要重点关注的问题。
4、需要加强道德约束。开放数据有可能侵犯数据提供者的个人隐私,在计算机环境下也存在个人数据的安全性问题,所以需要制定相应的管理措施。开放数据可能会侵犯生成数据的研究人员的个人利益,有必要使用新的方法来评价和奖励研究人员在这方面的贡献。
5、促进全球参与。最不发达的国家在收集、存储和共享数据方面的能力较弱,无法全面参与到气候变化、卫生保健、资源保护等全球性的研究活动中,也不能从这些研究活动中受益,新兴国家和发达国家应帮助不发达国家发挥其科学研究的潜能。
6、需要各层面的联合行动。数据开放的实现需要个人、学科、国家和国际层面的系统化行动。研究资助机构和研究执行机构应提供资金支持研究人员更智能地开放数据。学科领域应通过推动数据开放促进本学科的发展。一些国际组织应促进开放数据系统和过程的发展,保证国际数据的获取、互操作性和可持续性。
三、开放数据的原则
1、科学家有责任在论文发表后公开相关数据。便于其他人验证数据的有效性和研究结论的正确性,也便于其他人重新利用这些数据。
2、研究机构和高校有责任为开放数据提供良好的支撑环境。如提供数据管理、保存和分析方面的培训以及图书馆和数据管理服务等;为参与数据开放的科研人员的职业发展制定激励措施以及国家性或国际性标准;发达国家的大学和其他科研机构应与发展中国家的相应机构在开放数据方面进行合作,共同提高数据密集型科研能力。
3、出版商有责任向评审专家开放论文的相关数据。敦促研究人员对引用的数据进行准确标注;开放元数据以支持文本和数据挖掘,便于后续的分析。
4、资助机构需在资助项目中考虑开放数据的成本。为基础设施和数据仓库的长期可持续性提供资源和相关政策;在评价研究的影响时(尤其是引文指标)应考虑数据创建者的贡献。
5、各国的专业协会、学术团体和科学院应为开放数据工作制定指导方针和政策。
6、图书馆、档案馆和资料库有责任提供数据服务和技术标准。保证数据获取的便捷性和长期性。
7、在应用实践方面。应考虑个人隐私、国家安全和商业利益等问题,数据开放是有边界、有限制的;研究数据和元数据应具备最大程度的可互操作性;开放数据应尽可能地根据其内容和背景与其他数据进行关联,从而使其价值最大化。
(刘小玲)