开源机器学习项目正在兴起

作者: 2015-04-07 11:09 来源:其他
放大 缩小

2015年1月,美国Facebook人工智能研究院开源了一系列软件库[1],以帮助开发者建立更大、更快的深度学习模型。这些软件库可替代机器学习领域常用的开发环境Torch中的默认模块,可在更短的时间内训练更大规模的神经网络模型。Facebook这项举措代表了机器学习领域的一股趋势——开源项目正在兴起。这股趋势中还有4个项目值得关注》[2]

1、“深潜”(DeepDive)。2014年12月,美国国防部高级研究计划局(DARPA)资助了一个名为DeepDive的开源计划,旨在开发出能在人类指导下建立起决策能力的计算系统。DeepDive的主要目标是开发一个能够对非结构化数据进行分类的自动化系统,例如对科技期刊中的论文进行分类。该系统已经可以从Web页面和PDF文档等大量传统数据源中抓取数据,而熟悉SQL和Python语言的开发人员则可以深入利用DeepDive。

2、非结构化信息管理(UIMA)及“优答智能问答”(YodaQA)。UIMA是阿帕奇软件基金会(Apache Software Foundation)制定的一种用于文本内容分析的标准,能够支持多种编程语言,IBM的沃森(Waston)机器学习系统就基于阿帕奇软件基金会的UIMA开源架构。阿帕奇软件基金会的UIMA还不是一项完整的机器学习方案,而其在2014年1月发起的子项目YodaQA则更接近机器学习,YodaQA利用维基百科作为主要数据源、并利用UIMA处理数据。

3、“开放认知”(OpenCog)。OpenCog是GNU(一项旨在开发类Unix操作系统的自由软件工程项目)Affero通用公共许可协议下的一个开源项目,旨在为科研人员和软件开发人员提供一个共同平台,进而开发和共享人工智能软件。OpenCog始于2008年,目前已被科研机构和商业机构应用于自然语言处理中。

4、“问答系统开放进展”(OAQA)。OAQA是由IBM和卡耐基梅隆大学于2011年共同发起的开源项目,旨在开发用于开发自然语言问答系统的工具箱。OAQA也采用UIMA框架,并为IBM公司的沃森机器学习系统提供了许多借鉴。                              

(唐川)


[1] Facebook Open-Sources a Trove of AI Tools. http://www.wired.com/2015/01/facebook-open-sources-trove-ai-tools/.

附件: