美国NIH发布《数据科学战略计划》
该战略计划为NIH资助的“生物医药数据科学生态系统现代化建设”提供了发展路线图,并为该目标的实现提出了总体发展方向、战略目标和实施举措(图1)。其核心目标包括解决数据存储的高效性和安全性问题;使尽可能多的人能够使用数据(包括研究学者、科研机构和社会大众);发展壮大一支能够充分利用先进数据科学理论和信息技术的研究队伍;为数据使用中涉及的成果产出、使用过程的高效性和安全性,以及相关伦理问题制定相应的策略方针,最终确保由NIH资助的全部数据科学活动和相应产品能够符合FAIR原则,即数据可检索(Findable)、可访问(Accessible)、可交互使用(Interoperable)和可重复使用(Reusable)。
图1 《数据科学战略计划》的总体发展方向和战略目标
其中,数据基础设施、数据生态系统的现代化建设和数据管理、分析方法和工具三个发展方向的具体实施举措如下(表1)。
表1 《数据科学战略计划》的实施举措
发展方向 |
战略目标 |
实施举措 |
数据基础设施 |
优化数据存储,并提升安全性 |
统筹利用现有各级别(政府、科研机构及商业级别)的计算机系统,开展数据存储与分析 |
充分利用新兴的专业技术 | ||
响应对技术和基础设施的需求,优化数据安全、授权使用及数据索引和查找 | ||
连接NIH数据系统 |
利用NCBI作为纽带,在NIH数据共享空间(NIH Data Commons)与目前广泛使用的NIH数据库之间建立连接 | |
确保新的NIH数据资源与其他NIH系统的连接 | ||
在适当时候,开发与非NIH数据资源的连接 | ||
数据生态系统的现代化建设 |
数据库生态系统的现代化建设 |
对数据库与知识库分别予以支持 |
对不同类型的资源库,使用不同的资助策略、审查原则和管理方法 | ||
对动态测量数据的使用、效用和修订 | ||
确保数据的隐私和安全性 | ||
建立统一、有效、安全的敏感数据获取授权机制 | ||
对数据资源采用明晰的评估、生命周期、可持续性和衰退的期望 | ||
支持个人数据的存储和共享 |
通过PubMed Central和NCBI实现数据集与出版物的链接 | |
扩展NIH数据共享空间,实现个人FAIR数据集的提交、共享和索引 | ||
更好地将临床和科研数据整合到生物医学数据科学中 |
在包含临床和科研数据的NIH数据资源之间建立有效连接 | |
开发并运行通用的认证协议和用户授权系统,实现在NIH数据资源和平台中数据的更广泛获取,以及患者知情同意政策的执行 | ||
促进对NIH数据共享空间元素库(Elements Repository)的使用 | ||
数据管理、分析方法和工具 |
支持开发具有实用性、通用性,且使用无障碍的工具和工作流程 |
独立支持数据库和知识库的工具开发 |
利用适当的资助机制、科学评估方法和管理举措支持技术开发 | ||
设立项目,使来自私人部门的系统工程师能够对学术机构开发的原型工具和算法进行改良和优化,从而使这些工具能够在生物医药研究中有效、广泛的应用,并具有成本效益 | ||
利用一系列鼓励措施促进数据科学发展和工具创新研发 | ||
拓宽专业工具的获取渠道,提高使用能力 |
充分利用新兴的专业方法、算法、工具、软件和工作流程 | |
促进生物医药数据科学领域与数学、统计学、计算机科学、工程学和物理学的交叉创新研究 | ||
开发和采用更好的移动设备和数据接口工具,联合获认证的健康信息工具,进行数据提取和分析 | ||
开发改进的方法,以确保认证的电子健康记录和其他临床数据能够安全的、符合伦理的应用于医学研究 | ||
改进资源检索和资源编目 |
开发和实施数据索引、引用和修订跟踪的统一标准 |
(王玥)
[1] NIH releases strategic plan for data science. https://www.nih.gov/news-events/news-releases/nih-releases-strategic-plan-data-science