美国NIH加强大数据应用研究部署
2014年10月9日,经过近两年的筹备,美国国立卫生研究院(NIH)“大数据到知识”大数据应用研究重点计划宣布了首批资助项目[1],旨在通过支持数据科学及相关领域的研究、应用和培训,发展全新的途径、标准、方法、工具、软件并培养相关能力,增强生物医学大数据的使用。BD2K2014财年投资达到3200万美元,主要资助以下四个方面:大数据运作卓越中心、BD2K数据发现索引协调联盟(DDICC)、大数据培训及人员能力发展、大数据课程及开放式教育资源的发展(表1)。预计到2020年,BD2K计划可用资金将达到6.56亿美元。
新资助的11个卓越中心和1个联盟中,每一个中心/联盟重点应对一个特定的生物医学大数据挑战。目前生物医学大数据使用过程中面临七大主要挑战:(1)数据与软件工具的定位挑战;(2)数据与软件工具的可访问性挑战;(3)数据标准化与元数据挑战;(4)数据和软件共享政策与实践挑战;(5)生物医学大数据的组织、管理与应用挑战;(6)生物医学大数据分析方法挑战;(7)研究人员分析与设计能力挑战。
表1NIH资助首批大数据研究项目
| 
 类型  | 
 中心、联盟或项目名称  | 
 承担单位  | 
| 
 大数据运算卓越中心  | 
 大数据支持的生物医学知识因果关系建模和发现中心  | 
 匹兹堡大学  | 
| 
 表型计算预测中心  | 
 威斯康辛大学麦迪逊分校  | |
| 
 扰动数据整合研究国家中心  | 
 斯坦福大学  | |
| 
 大规模基因数据扩展性知识引擎KnowEng  | 
 伊利诺伊大学香槟分校  | |
| 
 翻译基因组学大数据中心  | 
 加州大学圣克鲁斯分校  | |
| 
 以病人为核心的信息共享中心  | 
 哈佛大学医学院  | |
| 
 动作传感数据知识转化卓越中心  | 
 孟菲斯大学  | |
| 
 扩展性数据标记和检索中心  | 
 斯坦福大学  | |
| 
 蛋白质数据知识转化团队:一个综合性平台  | 
 加州大学洛杉矶分校  | |
| 
 全球医学、成像和基因组ENIGMA中心  | 
 南加州大学  | |
| 
 发现科学大数据中心  | 
 南加州大学  | |
| 
 BD2K数据发现索引协调联盟和管理补助  | 
 BD2K数据发现索引协调联盟(DDICC)  | 
 加州大学圣地亚哥分校  | 
| 
 利用生物医学知识发现合理的药物警戒信号  | 
 德克萨斯大学医学科学中心  | |
| 
 临床数据库知识的发现与应用  | 
 哥伦比亚大学健康科学部  | |
| 
 高通量免疫球蛋白测序分析的计算方法  | 
 耶鲁大学  | |
| 
 临床与转化研究的自然语言处理  | 
 梅奥医学中心  | |
| 
 暴露数据集中性、整合性资源的建立  | 
 北卡罗莱纳州立大学  | |
| 
 核受体信号图谱中心  | 
 贝勒医学院  | |
| 
 疼痛功能性核磁共振成像生物标记物  | 
 科罗拉多大学  | |
| 
 心血管研究网  | 
 约翰霍普金斯大学  | |
| 
 大数据培训及人员能力发展  | 
 儿童执行功能的基因基础成像  | 
 宾夕法尼亚大学  | 
| 
 判断压力及缺乏锻炼状态下瞬时风险新方法  | 
 宾夕法尼亚州立大学  | |
| 
 单一癌症细胞异质性的综合生物信息学方法  | 
 夏威夷大学  | |
| 
 表观遗传异质性在慢性淋巴细胞白血病发展中的作用  | 
 Dana Farber癌症研究所  | |
| 
 关于邻里效应研究的社交媒体大数据资源  | 
 犹他大学  | |
| 
 传染性疾病模建和预测的多重数据资源整合框架  | 
 儿童医院组织  | |
| 
 神经科学大数据的非参数贝叶斯方法  | 
 杜克大学  | |
| 
 利用“序列-结构-功能”方法,对人类及大鼠基因组内蛋白编码错义突变进行功能描述  | 
 威斯康星州医学院  | |
| 
 发展针对神经大数据的云技术工具  | 
 宾夕法尼亚大学  | |
| 
 大数据课程及开放式教育资源的发展  | 
 协作式生物医学大数据培训开放资源  | 
 加州大学圣地亚哥分校  | 
| 
 人群的大数据教育:MOOCs和模块化智能辅导系统  | 
 约翰霍普金斯大学  | |
| 
 信息学分析BD2K技能课程  | 
 俄勒冈健康与科学大学  | |
| 
 将大数据公开教育资源加入国家协调员办公室健康IT课程  | 
 俄勒冈健康与科学大学  | |
| 
 Harvard X生物医学数据科学在线课程  | 
 哈佛大学  | |
| 
 BD2K概念网络:主动学习和工具的在线公开分享  | 
 加州大学洛杉矶分校  | |
| 
 计算机医学大数据课程  | 
 梅奥医学中心  | |
| 
 生物医学BD2K综合性主动学习框架  | 
 加州大学圣地亚哥分校  | |
| 
 大数据统计暑期学院  | 
 华盛顿大学  | 
(阮梅花 许丽)
[1] NIH invests almost $32 million to increase utility of biomedical research data. http://www.nih.gov/news/health/oct2014/od-09.htm.