科研众包——科研合作的新模式
“众包”从一种网络时代的新型经济模式,扩展到科学研究领域,成为一种科研合作的新模式。中国科学院文献情报中心的研究人员调研分析了国内外大量文献和案例,梳理了科研众包的兴起及其与时代和科技发展需求的关系,分析了科研众包的运作模式、优势与影响及存在的问题,并提出了一些建议。
一、 科研众包的兴起
“众包”原本是一种网络时代的新型商业模式,指由个体、机构、非盈利组织和公司向具有不同知识背景的一组个体公开发起、自愿参与的在线活动[1]。当众包项目以科学发现和解决科技面临的挑战问题为目的,发起者为科研机构或科学家时,众包便从一种商业模式拓展为一种新型的科研合作模式,大大地改变了人们对科研合作的传统理解。这样的众包即为“科研众包”(Science Sourcing),参与众包科研项目的志愿者往往被称为“公民科学家”(Citizen Scientist),这类研究项目也因此被称为“公民科学计划”(Citizen Science Project)。
科研众包兴起的前提是互联网的普及和对海量数据处理能力的需求,即挖掘数据的能力始终落后于科学家们收集或生成数据的能力;科研众包的成功开展需要公民科学家的广泛自愿参与。
二、科研众包的运作模式
科研众包的典型运作模式必须有下述3个重要的行动要素:公民科学家;研究机构,即众包项目的发起者和设计者,也是项目的获益者;中介平台或合作伙伴网络。
1、公民科学家
公民科学家是众包项目的主要参与者,也是科研内容或服务的提供者。他们自愿投入金钱、计算机资源、人力、时间等来参与科研活动。科研众包项目的成功与否很大程度上取决于是否能吸引足够多的公民科学家参与,并激发他们的热情与发挥他们的能力。
公民科学家参与科研众包的形式与深入程度依据科研众包细分任务而定。当众包科研项目的任务比较单一,不需要参与者投入脑力活动,只需其利用用户计算设备的空闲时间参与科学计算,如分布式计算项目便属此类,这类众包方式已应用于搜索梅森素数,寻找引力波存在的证据[2],蛋白质结构预测与设计,研究气候变化的趋势[3]等;当众包科研项目的任务更为复杂,对公民科学家的专业水平要求会相应提高。比如,美国怀俄明大学化学教授Bruce Parkinson希望合成一种合适的催化剂来驱动生成氢燃料,因为60多种金属之间的可能组合是多种多样的,所以,他将催化剂设计成为廉价、快速、简单组合等几类化学试剂盒,为此,该合成项目吸引了70所大学和高中的500多名学生参与,很快创造出了独特的金属氧化物,并在共享的数据库中记录了所有的实验结果。
2、众包项目的发起者与设计者
众包项目的发起者和设计者常常是某个学科领域的专职科学家或专门的科研机构。众包项目能否获得成功,项目发起者的众包方案设计至关重要,这是众包项目的前期核心工作,而不同类型的科研众包其设计方案有别。
(1)集成型科研众包(Integrative Crowdsourcing)
这类科研众包旨在收集更多更广泛的分布式信息,其成功的关键在于吸引广泛多样的个体的热情参与。项目设计的重点是考虑如何将总体需求分解为单个可执行的、有趣的简单任务,并兼顾任务的执行环境、手段与工具,以及公民科学家的专业水平等因素,同时更多考虑响应回馈,给予参与者有价值的激励。项目设计者还需考虑如何整合与分析广泛的分布式信息[4]。
此类案例较多,Foldit蛋白质折叠游戏便是其中的典型案例,它设计用于解析蛋白质酶的结构,玩家可以通过在屏幕上随机折叠分子塑造新的蛋白质,它的辉煌成绩是在3周内解开了困惑科学家20年的一个艾滋病相关酶的蛋白质结构。Foldit对每位玩家的专业水平几乎没有要求,玩家只需要1台联网的电脑,在简单的指导下便可以用鼠标随意创造和修改蛋白质,正是因为对玩家的专业要求低,任务细分明确,游戏设计有趣,才激励了大量用户参与,从而解决了复杂的科学问题。该项成果发表于《自然结构与分子生物学》杂志上[5]。英国癌症研究中心的众包癌症研究也采用游戏的形式,由玩家鉴定癌症的诱因,从而加速了癌症治疗研究。
美国国家海洋和大气管理局(NOAA)的对近地面降水量识别项目也是集成型科研众包的例子[6]。NOAA于2012年12月推出了一款可在手机的Android和iOS系统中使用的移动应用程序,以众包的方式收集卫星记录雷达无法达到之处的数据,并呈现在Ping网站上,数据还能以动画方式在美国地图上展示,并自动刷新与实时监控。环境科学的众包项目多见此类集成型模式。再如众包药物实验,有些身患重病的患者会尝试一些没有经过严格测试的药物。通过在社交网站上追踪使用和未使用过这些药物的人群的数据来了解某种药物的临床效果等。
(2)选择型科研众包(Selective Crowdsourcing)
这类科研众包计划的唯一目的就是找出最优解决方案。它不需要设计细分任务,但要提出明确的需求和目标,并需在最优解决方案的选择和激励上投入更多时间与精力。
这类科研众包的典型案例来自Netflix公司。该公司曾困扰于影片推荐准确性不够的难题,在投入大量研发费用解决此问题无大改观后,该公司通过公开发布征集解决方案,提供悬赏等激励办法,快速吸引了全球186个国家的上千个研发小组参与了算法的改进,并成功实现了将影片推荐准确性提高10%的目标。类似模式对解决目标明确的复杂问题非常有用,主流的科研众包平台(innocentive.com)上就可看到大量这类研究项目,比如:NASA要求寻找一种新的方法用可视化技术分析气候和地球科学数据项目;美国打击恐怖主义技术办公室希望设计一套信息管理和分析的手机系统项目等。
3、中介平台/合作伙伴网络
与传统科研组织形式不同,科研众包合作的顺利开展非常依赖能够聚集大量用户或合作伙伴网络的网络平台或社区,进而才能将专职科学家、公民科学家以及合作伙伴等各方力量连接和组织起来解决实际问题。
第一个典型例子是Innocentive.com平台,它是由美国创建、能帮助很多机构解决所面临的挑战和关键技术问题的科研众包平台的先驱。美国主要的政府机构、非盈利组织和商业企业都在该平台上提交困扰他们的技术难题和面临的挑战等来寻求最佳的解决方案和途径,而具备解决这些难题和挑战能力者都可以获得解决问题的机会。每项挑战为提出最佳解决方案者出资奖金从1万美元~10万美元不等,同时Innocentive公司也可获得一定报酬。
另一个典型例子是Arch2POCM科研众包合作平台,它通过采用公-私合作的开放资源模式,主要关注肿瘤、免疫、自闭症和精神分裂症等领域的新药物研发,大力促进了生物医学研究的创新。该科研众包平台的研发模式具有特色:首先确定优先研究的目标。从科学家和临床医学专家共同提出的药物靶点清单中筛选符合标准并有潜力的目标;每个目标选择两个试验化合物在Arch2POCM联盟内部的机构中展开研究,并融合探索药物试验早期阶段的数据,而最终试验产生的数据、化合物的结构等信息都可公开共享,且不受专利版权的限制;相关的制药组织还可以购买试验化合物或者试验性新药数据库进一步开展临床研发和商业化。这种科研众包合作研究模式可大大缩短优先药物靶点向II 期临床试验转化的时间,并大大减轻生物医药企业的研发经费负担,有利于药物研发行业的复兴。
三、科研众包的影响和优势
科研众包突破了不同学科间的界限,公开数据或任务需求,通过网络和众包平台聚集各领域的科学家、技术人才,以及利益相关者,使跨学科研究更为便利;科研众包突破了专职科学家和业余科学家的界限,使有一技之长的任何个人都可以投入自己的智力和时间参与到科学发现和知识创造中,并获得回报[7];科研专职科学家的工作模式也在发生改变,越来越多的科学家意识到公众可以作为劳动力、技能、计算能力甚至是财政资助的重要来源,他们如果充分地利用这些公众将会有更多时间和精力投入到对专业水平要求更高的研究创新中;科研众包让科学发现走出实验室,在减少了研发操作成本、优化科研资源配置的同时,还提高了科研成果的影响力与普通公众的认知度和参与度。因此,科研众包在作为一种科学教育和科学传播的形式、促进公众对科学的理解的作用上也颇值得重视[8]。科学家必须也有责任让公众理解科学研究的价值,而众包科研项目可以让公众亲身参与研究,无疑是实现这一目标的良好手段之一[9]。
四、众包科研合作存在的问题
1、适用性问题
通常认为,众包项目适用于知识结构比较明确,界定清晰,投机行为风险较小的情况,而对可能涉及国家安全和商业机密的研究项目则不适宜。究竟哪些项目可用众包形式开展,需要专门机构或组织评估,以降低风险。
2、科研众包的相对不可控问题
相比传统的科研合作模式,科研众包项目的研究人员对项目成功与否的可控性不太强,存在失败的风险。失败风险不仅仅来自项目有可能无法吸引大量公民科学家的积极参与从而流产,还可能来自项目生成数据的质量控制问题。目前,科研众包项目采用数据质量控制的办法[10]通常有:(1)从研究结果入手,邀请专家进行独立的质量评估,或交叉评估;(2)从组织方式入手,建立更好的工作者组织管理机制; (3)从研究设计入手,合理地细分和设计具体操作等。
3、众包科研成果的评估问题
目前,众包科研成果的认定和评价依旧采取传统科学评价的做法,即通过项目的主要负责人撰写研究论文发表在学术期刊上从而获得学术界的认可,成果影响力的评价也与传统评价方式无异,而并未合理评估采用众包模式的增值效益和社会效应。因此,未来需要一种更适应众包科研合作项目的成果评定方法,以准确合理地评价科研众包成果的学术价值,充分考虑科研众包合作所产生的积极的社会效益和对科学教育的影响等。
五、促进科研众包的政策建议
1、研究机构应积极鼓励研究人员尝试众包模式来解决科学问题
研究机构应鼓励有条件的科研项目在一定程度上采用众包模式并将其作为一种备选形态,对有此意向的科学家给予资金、技术和政策倾斜。众包科研项目不仅仅是一种纯粹的科学研究项目,在取得科研新发现的同时,它可节约宝贵的科研经费,优化科研资源的配置和项目的人员结构,还能增强专业科学家与公众的交流,扩大研究活动和研究机构的社会影响力,以及公众对科研活动的认知度和参与度。这些突出的积极效应可在研究机构的鼓励和最终的评价中显现。
2、前瞻预判科研众包的风险及知识产权问题
在众包项目实施前,前瞻性地预判科研众包的风险及知识产权等问题,可以有效规避和降低众包项目的风险性。担当众包项目的发起者和设计者的科研机构,在项目开始前,建议成立负责众包项目的风险管理和知识产权管理的专门委员会,要求众包项目的主要负责人提交具体的操作计划,在此基础上,制定项目成果的版权归属规章和约定,评估操作的可行性和可能的风险,这里的风险不仅仅是项目失败的风险,还包括对可能的社会影响进行预判和防范。对不适用于众包模式的研究项目,研究机构也要防范其未经许可地采用众包模式后而导致的负面影响。
3、研究资助机构增设专门的公民科学项目
美国国家科学基金会资助的公民科学项目已从21世纪初的每年几个发展到2012年的每年至少25个。全球开展的公民科学项目已有数百个,出版的相关出版物至少有1000 件。我国也可开设专门的科研众包项目,这不仅可推进创新的科学发现,也可促进培养更具科学素养的公众和激励下一代科学家。
科研资助本身也可采用众包形式。如今,众包科研资助已成为一种获取科研经费的可能路径。科学家可将研究项目在众包科研资助平台上公布,以寻找有热情和能力的公众给予资助。在国际上知名的众包科研资助平台(如RocketHub,Petridish)上可看到等待得到资助的研究项目,这方面已有很多成功案例。
4、建设有影响力的科研众包平台或合作伙伴网络
由于众包项目特别依赖有影响力的中介平台或合作伙伴网络,而中国目前尚缺乏此类具有号召力和影响力的可靠的中文网络平台,创造条件鼓励此类平台的建设也是必要的工作之一。
(卫垌圻 姜涛 陶斯宇 谭宗颖)
[1] Estellés-Arolas Enrique,Fernando González-Ladrón-de-Guevara. 2012. Towards an integrated crowdsourcing definition. Journal of Information science,38(2):189-200.
[2] Einstein@Home. http://www.equn.com/wiki/Einstein@Home.
[3] Climate prediction. http://www.equn.com/wiki/ClimatePrediction.Net.
[4] Schenk E.,Guittard C. 2011. Towards a characterization of crowdsourcing practices. Journal of Innovation Economics & Management,1(N°7):93-107.
[5] Khatib Firas,Frank DiMaio,Foldit Contenders Group. 2011. Crystal structure of a monomeric retroviral protease solved by protein folding game players. Nature structural & molecular biology,18(10):1175-1177.
[6] Earthobservatory. http://earthobservatory.nasa.gov/Experiments/.
[7] 科研社交网络与众包平台研究报告. http://www.coinsay.com/article/coinsay_3165.html
[8] Brossard D.,Lewenstein B.,Bonney R. Scientific knowledge and attitude change: The impact of a citizen science project. International Journal of Science Education,2005,27(9):1099-1121.