美国NIH加强大数据应用研究部署
2014年10月9日,经过近两年的筹备,美国国立卫生研究院(NIH)“大数据到知识”大数据应用研究重点计划宣布了首批资助项目[1],旨在通过支持数据科学及相关领域的研究、应用和培训,发展全新的途径、标准、方法、工具、软件并培养相关能力,增强生物医学大数据的使用。BD2K2014财年投资达到3200万美元,主要资助以下四个方面:大数据运作卓越中心、BD2K数据发现索引协调联盟(DDICC)、大数据培训及人员能力发展、大数据课程及开放式教育资源的发展(表1)。预计到2020年,BD2K计划可用资金将达到6.56亿美元。
新资助的11个卓越中心和1个联盟中,每一个中心/联盟重点应对一个特定的生物医学大数据挑战。目前生物医学大数据使用过程中面临七大主要挑战:(1)数据与软件工具的定位挑战;(2)数据与软件工具的可访问性挑战;(3)数据标准化与元数据挑战;(4)数据和软件共享政策与实践挑战;(5)生物医学大数据的组织、管理与应用挑战;(6)生物医学大数据分析方法挑战;(7)研究人员分析与设计能力挑战。
表1NIH资助首批大数据研究项目
类型 |
中心、联盟或项目名称 |
承担单位 |
大数据运算卓越中心 |
大数据支持的生物医学知识因果关系建模和发现中心 |
匹兹堡大学 |
表型计算预测中心 |
威斯康辛大学麦迪逊分校 | |
扰动数据整合研究国家中心 |
斯坦福大学 | |
大规模基因数据扩展性知识引擎KnowEng |
伊利诺伊大学香槟分校 | |
翻译基因组学大数据中心 |
加州大学圣克鲁斯分校 | |
以病人为核心的信息共享中心 |
哈佛大学医学院 | |
动作传感数据知识转化卓越中心 |
孟菲斯大学 | |
扩展性数据标记和检索中心 |
斯坦福大学 | |
蛋白质数据知识转化团队:一个综合性平台 |
加州大学洛杉矶分校 | |
全球医学、成像和基因组ENIGMA中心 |
南加州大学 | |
发现科学大数据中心 |
南加州大学 | |
BD2K数据发现索引协调联盟和管理补助 |
BD2K数据发现索引协调联盟(DDICC) |
加州大学圣地亚哥分校 |
利用生物医学知识发现合理的药物警戒信号 |
德克萨斯大学医学科学中心 | |
临床数据库知识的发现与应用 |
哥伦比亚大学健康科学部 | |
高通量免疫球蛋白测序分析的计算方法 |
耶鲁大学 | |
临床与转化研究的自然语言处理 |
梅奥医学中心 | |
暴露数据集中性、整合性资源的建立 |
北卡罗莱纳州立大学 | |
核受体信号图谱中心 |
贝勒医学院 | |
疼痛功能性核磁共振成像生物标记物 |
科罗拉多大学 | |
心血管研究网 |
约翰霍普金斯大学 | |
大数据培训及人员能力发展 |
儿童执行功能的基因基础成像 |
宾夕法尼亚大学 |
判断压力及缺乏锻炼状态下瞬时风险新方法 |
宾夕法尼亚州立大学 | |
单一癌症细胞异质性的综合生物信息学方法 |
夏威夷大学 | |
表观遗传异质性在慢性淋巴细胞白血病发展中的作用 |
Dana Farber癌症研究所 | |
关于邻里效应研究的社交媒体大数据资源 |
犹他大学 | |
传染性疾病模建和预测的多重数据资源整合框架 |
儿童医院组织 | |
神经科学大数据的非参数贝叶斯方法 |
杜克大学 | |
利用“序列-结构-功能”方法,对人类及大鼠基因组内蛋白编码错义突变进行功能描述 |
威斯康星州医学院 | |
发展针对神经大数据的云技术工具 |
宾夕法尼亚大学 | |
大数据课程及开放式教育资源的发展 |
协作式生物医学大数据培训开放资源 |
加州大学圣地亚哥分校 |
人群的大数据教育:MOOCs和模块化智能辅导系统 |
约翰霍普金斯大学 | |
信息学分析BD2K技能课程 |
俄勒冈健康与科学大学 | |
将大数据公开教育资源加入国家协调员办公室健康IT课程 |
俄勒冈健康与科学大学 | |
Harvard X生物医学数据科学在线课程 |
哈佛大学 | |
BD2K概念网络:主动学习和工具的在线公开分享 |
加州大学洛杉矶分校 | |
计算机医学大数据课程 |
梅奥医学中心 | |
生物医学BD2K综合性主动学习框架 |
加州大学圣地亚哥分校 | |
大数据统计暑期学院 |
华盛顿大学 |
(阮梅花 许丽)
[1] NIH invests almost $32 million to increase utility of biomedical research data. http://www.nih.gov/news/health/oct2014/od-09.htm.