“大数据时代的生物医学与交叉科学”

作者: 2015-05-20 09:36 来源:中科院上海交叉学科论坛网
放大 缩小

  2014年6月13日,由中国科学院上海生命科学研究院青年创新促进会组织的、以 “大数据时代的生物医学与交叉科学”为议题的论坛在中国科学院上海分院交叉科学中 心举行。上海生科院植生所赵国屏院士,上海生科院神经所郭爱克院士,上海生科院生化细胞所陈洛南研究员,复旦大学张锋教授,上海交通大学师咏勇教授等受邀 参加了本次论坛。受邀嘉宾和与会的上海生命科学研究院,上海巴斯德研究所,上海药物所,上海有机化学所的青促会会员就在大数据时代的生物医学的研究展开了 科学讨论。论坛由上海生命科学研究院青年创新促进会优秀会员、上海生科院计算生物学研究所徐书华研究员主持。

  赵国屏院士:从大数据到E—cell

  赵国屏院士深入浅出的介绍了大数据的内涵:离散生物学数据和背景数据构成了大数据。离散生物学数据构成了生物信息,这些生物信息极大的充实了生命科学知识,基于这些信息发展出生物信息学,数量遗传学,群体遗传学,计算生物学,系统生物学,合成生物学等多种学科。

  展望了大数据带来的技术挑战和未来方向:各种组学(omics)技术推动了生物大数据的产生。例如EBI数据库涵盖20 petabytes基因、蛋白、小 分子数据;基因组数据;组学结合转化型医学研究生产的临创数据和历史性数据。这些大数据不断系统化,遵循4P原则即:个体化 (personalized)、预测(predictive)、干预(preemptive)、参与(participation)。每个人不仅产生数 据,也在贡献数据的完善。赵院士还举了一些生动的例子,比如医院刷卡的故事,说明大数据的来源和个体在其中的贡献;支原体和E—cell;如何把text 数据变成data的潜力。

  赵院士以独到的注释讲解了大数据具有公认的4V特性:

  volume 量态——海量;velocity 动态——高通;variety 状态——复杂;value价态——超值

  回顾历史展望未来总结了科学研究的范式(Paradigm):

  实验(伽利略)——理论分析(牛顿)——计算和模拟(上世纪)——数据密集型科学(本世纪)
      大数据设施是我国的研究发展重点,谁来做,谁愿意做大数据整理和收集工作是难点。赵院士还提醒青年学者,作为实验工作者不要忘记实验外的大数据,数据工作者不要忘记数据要为实验服务。

  最后,赵院士结合合成生物学,讲解了这一高度交叉的前沿科学对大数据的依赖。建设性的指出我们应该关注转化医学的“三人主 义”:of the people, by the people, for the people. (林肯)。在大数据时代不能只看到数据本身,要同 时加强大数据文化建设:communication, collaboration, coordination(有助于解决中国机构分割问 题), credit. 
      

  郭爱克:大数据开启脑联结组研究

  郭院士用一组惟妙惟肖的诗词开题“脑比天恢 宏,若将两相并,脑中有天堂,君方在其中。” 恩格斯认为思维者的精神是世界上最美的花朵。指出脑科学的奇巧和数据量之大。指出当代脑与认识科学的研究目 标:理解脑、保护脑、模拟脑、发展脑。指出达尔文进化论是生命科学研究的根本。生物学没有铁的定律。演化产生机制。随后,郭院士回顾了脑科学发展至今在历 史上的重大发现。

  西班牙科学界拉蒙.依.卡哈尔1960诺贝尔发现神经元。

  巴甫洛夫,条件化之前、中、后狗的条件反应。

  Hebb, 突触修饰和细胞群,神经递质。控制论,反馈。

  休伯尔. 威瑟尔,视觉,单细胞记录。

  以及Roger w.sperry左右半球,Dr.Maee计算视觉理论,Kandel 2000诺贝尔,海兔的学习和记忆,Thomas.H.Morgan果蝇drosophila 100y。

  在这些前人工作的基础上,我们积累了关于脑的复杂结果数据,似如诗人张先的诗句“心似千丝网,中有千千结”。 在大数据时代,脑科学的研究应注重:因果+关联,研究哪些结构是特有的,那些是进化得到的,提出可以供人追逐几十年的重要科学问题。
      

  陈洛南: Dynamics embedded in biological big—data

  陈洛南研究员以“上医治未病”的想法出发,结合自己的研究方法,讲解了如果从大数据的动态网络标识诊断未病的创新想法。其认为在疾病发生前存在一个pre— disease status 前疾病状态,或者说是Limit of normal的临界状态,在这个临界状态一群基因的关联特意性加强,而他们与其它 基因关联突然消失。通过对病人数据的大量分析,找到这一疾病状态可以在疾病发生之前预测疾病的发生。同时,我们在寻找致病基因的时候不要忘记寻找健康基因 也是一种保持健康预防疾病的出路。
      

  张锋(百大计划):基于高通量基因组数据的拷贝数变异(CNV)分析

  张锋教授介绍了即便在正常人之间也有大尺度、大拷贝数的基因变异,可以通过比较基因组杂交芯片技术,鉴定到这些变异,解释一些罕见病和遗传病的发生。同时, 其建设性的提议在未来应该进行SNP数据与基因copy数据的合并分析,对基因组变异进行全局分析。张锋教授同时致力于基因组数据库的建设和共享,对大数 据的交流交换作了很好的范例。

      

  师咏勇:基因组大数据指导下的精确治疗

  师咏勇教授用众多现实病例生动的讲 述了如何通过基因组分析和大数据挖掘实现个性化治疗, 以白血病人Lukas的病例介绍了如何通过大数据挖掘找到针对白血病的特异性致病基因用药治愈的故 事,同时其介绍了如何应用GWAS(genome –wide association study)数据用于治疗和药物的重定位。

  徐麟:植物再生的转录与表观组学分析

  植生所的青促会会员徐麟研究员介绍了植物全能性理论在农业生产技术中广泛应用,其中组织培养是转基因事物的重要技术。而组织培养的关键是愈伤组织培养。其主 导的研究发现愈伤组织的表达谱最类似于根尖干细胞。通过叶再生愈伤组织转录组分析发现了愈伤组织发生的3个阶段:
stage 1: 激活,生长素响应期
stage 2: 关闭,叶特征基因
stage 3: 激活,根特征基因
发现了参与再生的表观遗传因子: polycomb (沉默叶特征基因),ISWI(激活根特征基因),解除了下述突破性的结论:
        1.愈伤组织是无序分裂的根尖干细胞
        2.只有叶中的干细胞可再生出愈伤组织
        3.愈伤组织发生是一个转分化过程
        4.愈伤组织发育受外源高浓度激素(被动过程)和内部发育信号(主动过程)的共同调控。
例子:禾本科(水稻)成熟叶片无形成层,无干细胞,因此无法成为愈伤组织。

      阳怀宇:电压门控钾离子通道小分子调控策略
     上海药物所德青促会会员阳怀宇副研究员通过对钾离子通道结构解析,发现第四跨膜区的门控电荷通路疏水性(苯丙氨酸)决定了其门控机制。研究思路:
      1. MD模拟发现KCNQ2结构不同于Kv1.2.
      2. 通过分子探针模拟结合口袋处残基
      3. 基于结构设计药物,激动剂
      4. 用小鼠急性癫痫模型进行验证

      上海巴斯德所的郝沛研究员做了题为“数据驱动的科学研究—生物信息学在分子病毒学领域的应用”的报告,她结合自己在基因组、转录组和蛋白组上的研究详细介绍 了自己的研究思路和研究方向,讲解了对大数据的理解和在病毒感染的诊断、治疗、抗药性和致病机制研究上的应用。她强调了大数据不等于 data mining,而是要抓住生物大数据特点:大量、高速、多样、价值,找到有价值的信息,做到数据的整合。
主要探讨和介绍了下述研究方向:
      1.穷举法设计保守引物,鉴定病毒种类,诊断感染性疾病。
      2.高通量测序检测新生病毒和未知感染病例。
      3.H7N9病毒感染病人,RNA—seq, 转录组分析RNA—editting的宿主基因,薛兆可能的药物靶点和致病机制。
      4.基于肽段组合的疫苗设计(穷举法)可以应用于HIV 病毒的Personal vaccine design。
      5.建立病毒蛋白和宿主蛋白互作的数据库。

     上海有机化学所的孙炳峰副研究员:基于新策略的活性天然产物的高效全合成
天然小分子化合物有很多实用价值。靠天然提取,来源有限,产量有限。目前主要通过人工合成(全合成)或者天然提取+人工合成(ex:紫杉醇)两种方法。
成果:
     1.Huperzine A, HuperzineB,Huperzine U. 是药物石杉碱甲片的重要组分。天然来源于植物千层塔,但含量低,通过优化合成方法,非对称合成,提高到只需10步反应,得到17%产率。
     2.Epothilone B/D. 治疗乳腺癌晚期药物分别提高到11步反应,9.1%得率,以及10步反应,12%得率。
     3.其它。englerin A (抗RCC肾细胞癌) 、plathencin抗生素合成。

      建议:
      徐书华研究员建议可利用青促会的组织能力和号召力组织生命信息学培训班,在生物学研究离不开大数据和数据处理的时代,针对性的培训可以提高科研工作者和学生 对数据的认识和利用效率。上海巴斯德所的郝沛研究员建议选好授课对象,提议可以结合巴斯德已有的课程展开针对性地培训。
     徐书华研究员提议联合复旦、交大的青年科学家一起举办学术研讨会,打破高校和科研院所之间的壁垒,做到真正的交叉互补,促进青年科学家之间的交流,制造合作交流 的气氛和机会,碰撞出更多的科学火花,以期在讨论中提出重要的科学问题。同时,合作不仅促进科学研究本身,还能够储备人才,扩展知识面,扩展思路。

      会议最后提议在年末组织青年科学家年会,加强和巩固青年科学家的交流和联系,通过交流避免重复研究,优势互补。

  附图:

  

  

  

  

  

附件: