Karen Liu
近几年来,全球科技巨头不约而同地在做同一件事:将旗下的AI项目开源,与全世界的开发者共享。
谷歌在2015年11月推出TensorFlow,是一个基于数据流图的开源软件库,也是该公司研发的第二代机器学习系统。曾经以“阿尔法狗”而一战成名的DeepMind公司已经被谷歌收购,该公司将AI训练平台Labyrinth开源,更名为DeepMind Lab。微软公司在2016年开源的Microsoft Cognitive Toolkit(曾用名CNTK)是一个“与人脑类似”的深度学习工具包,能够被用于进行机器翻译、图像识别、文本处理等任务。Facebook公司的Torchnet是一个以深度学习为中心的开源项目,是此前Torch开源项目的升级版。
这个名单还很长,包括亚马逊、IBM,以及国内的百度、腾讯、阿里巴巴等。这股开源风潮始于学术界,聚集了大量高校研究人员与计算机开发者的成果,基于互联网的“共享精神”,这个高度协作与跨越地域的社区成为开源的最佳土壤。那么,对这些科技巨头而言,促使他们纷纷开源重量级AI项目的原因是什么呢?
辐射其他产品
这些开源项目可以与公司的其他科技产品相结合,从而带来辐射效应。以TensorFlow为例,当一个用户在使用它的数据库时,能更加顺畅地连接谷歌的云服务。也就是说,在使用这个免费的工具时,用户会很自然地被引导到需要付费的服务,比如数据储存或者计算能力提升等。
树立公司形象
今年6月,微软公司宣布以75亿美元价格收购GitHub——全球最大的线上开源编程代码社区。这步棋让不少人感到意外,因为微软曾被视为开源的“敌人”。根据科技新闻网站Wired的分析,微软曾经与劲敌、开源系统“Linux”有过法律官司,因而积累下了“开源社区刽子手”的声誉。对全球开发者而言,开源代表着一个企业乐于共享、推动进步的姿态,更是对自身业务体系的信心。换言之,加入开源行列可能意味着企业形象的提升,意在口碑而非市场份额。
AI基础设施
正如AI之前的其他互联网技术,科技巨头们迈向成功最重要的一步是建立网络基础设施,让自己成为万千用户的平台。在AI时代,这个道理依然不变。今年3月,Facebook宣布进一步加强其AI硬件基础设施,目的是“打造具有竞争力的平台,支持与加速对AI的需求”。该公司在其声明中称:“开放性合作有助于促进面向未来的设计创新,让我们能够构建更复杂的人工智能系统,最终为改善Facebook的使用体验提供动力。”
虽然这些开源项目听上去是完美的“多赢方案”,因为开发者、小型团队可以借力这些平台,又能够为其添砖加瓦,而提供这些AI学习框架的公司也能从中得益。但是,对于如何进一步完善这些开源项目,许多用户提出了意见。
科技雷达网站专业版刊登的一篇文章称,微软公司是在开源与商业利益中平衡。作者分析了微软公司的开源工具图谱,认为它们主要都是微软公司“盈利不多”的领域。援引商业分析公司Directions副总裁Wes Miller的话,诸如谷歌、苹果和微软等公司都是进行战略性开源的,主要是帮助建立社区和推进合作,而这些公司真正重要的业务领域并未开放。
而企业家网站发布的另一篇文章中,作者则表示,在AI领域真正重要的并不是代码或算法,而是能够帮助机器训练的数据。这些科技巨头仅开放代码,但不开放数据的做法就像是“给了我们翅膀,但是不给我们天空”