下下围棋就够了?看看谷歌大佬如何引领人工智能商业化

人工智能,作为目前全球科技行业最热的关键词,几乎所有大型科技公司都在加大对其的投入,而怎样实现人工智能技术的落地,更是业内一直在探讨的热点话题。目前,谷歌一直被认为是拥有最先进人工智能技术的互联网搜索公司,由于前期在人工智能领域进行研发的时间比较长,加上收购了优秀的专业公司,其在人工智能领域遥遥领先。

2017 年,谷歌在人工智能上的成就,也与三年前击败Facebook、成功收购DeepMind紧密相连。震惊世界的“阿尔法围棋”为谷歌旗下的DeepMind(深思公司)所研发,该下棋软件击败了许多世界级的知名棋手,让人工智能再次获得世界瞩目。有更多的消费者或者企业希望能够使用上该公司的人工智能技术,谷歌的人工智能技术也开始走向商用化。

实际上,包括微软英特尔、Facebook等在内的研究企业,也正在把人工智能推向市场自2010 年开始,《麻省理工科技评论》每年都会选出“全球50 大最聪明公司”,作为科技创新的代表。一直走在行业前沿的谷歌及英伟达等企业多次出现在该榜单中。

2014 年,3 家公司因为人工智能而上榜“全球50 大最聪明公司”,上榜公司的总市值接近6000 亿美元。排在2014 年“全球50 大最聪明公司”榜单第3 位的是谷歌,它以超过5 亿美元赢得DeepMind 公司。DeepMind 将机器学习与神经科学结合起来,创建了“通用学习算法”。

2012 年,Google X 实验室开发出了一套具备自主学习能力神经网络系统。不助任何外界信息的帮助,这种神经网络系统就能从1000 万张图片中找出那些有小猫的图片。在开始分析数据之前,研究者不会向系统输入任何诸如“猫是什么样子”的信息。一旦系统发现了重复出现的图像信息,计算机就会自动创建一个“图像地图”,该地图稍后会帮助系统自动检测与前述图像信息类似的体。这个项目没有像通常做的那样由研究人员为算法框定边界,而是直接把海量数据投放到算法中,让算法自动从数据中学习。这个项目的技术被应用到了安卓操作系统语音识别系统上。

生于1976 年、坚信“数据会说话”的吴恩达(Andrew Ng)是谷歌“识猫”项目负责人之一,他也曾是斯坦福大学计算机科学系和电气工程系的副教授斯坦福人工智能实验室的主任。2008 年,吴恩达入选《麻省理工科技评论》“35位35 岁以下科技创新青年”。 2011 年,吴恩达在谷歌创建了“谷歌大脑”项目,通过分布式集群计算机开发超大规模的人工神经网络。此外,他还与达芙妮·科勒一起创建了在线教育平台Coursera。2012 年,吴恩达开始在 Coursera 平台上线面向全球的机器学习课程。到2017 年年初,Coursera 平台的选课人数已达180 多万人。2013 年,吴恩达入选《时代》杂志年度“全球最有影响力100 人”,成为16 位科技界代表之一。

把自己的“聪明”程度与人工智能研发越来越紧密地相连,表明一线大公司对人工智能的潜能与其在更广泛领域的商业化前景越来越看好。随着流向人工智能的资本增加,为之铺设“高速公路”的基础设施商突然意识到了新的需求和机会——芯片业开始发力。

人工智能的一个创新方向是为智能手机创建能够运行神经网络的硬件。排在2014 年“全球50 大最聪明公司”榜单第18 位的高通公司,因开发以“神经元”计算切入的芯片算力突破技术,2013 年的营收增长30%。高通当年的市值最高超过1000 亿美元,排在英特尔之前(2012 年11 月高通的市值第一次超过英特尔)。

谷歌开发出“认得”猫的人工智能时,在“看”YouTube 视频的那个“它”有16000 个处理器和10 亿个节点。普渡大学的科学家则努力以更紧凑、更节能方式设计深度学习硬件,使智能手机和其他移动设备也能理解图像和视频内容。

2013 年12 月,在美国内华达州的神经信息处理系统大会上,普渡大学研究小组展示了与传统智能手机处理器连接的协处理器。这个协处理器可以帮助手机运行深度学习软件,能够检测街道场景的面部或标签部分。协处理器的设计在FPGA 上进行了测试。FPGA 是可重新配置的芯片,可以通过编程来测试新的硬件设计。

当然,该原型机没有谷歌“识猫”的人工智能那么强大,但它显示出新的硬件设计可以令Google Glass 这样的智能可穿戴设备也“理解”照片或视频。而以此为基础开发的应用程序能够在识别出特定的人(如妈妈)、对象(如出租车)或场景(如医院)后采取行动。

深度学习是由模拟神经元构成的多层网络过滤数据。单个的模拟神经元构成虽然简单,但一起工作却可能表现出复杂的行为计算机模拟这样的网络,效率并不高。普渡大学的协处理器专门用于运行多层神经网络,并将其用于大量的图像。在测试中,原型机的效率是GPU 的15 倍,系统改进后的效率更可以达到目前效率的10 倍。

主持这项研发普渡大学教授Eugenio Culurciello 已经创立了一家名为Tera Deep 的公司,将自己的设计商业化。与此同时,HRL 实验室(波音通用汽车的一个联合实验室)神经和涌现系统中心主任Narayan Srinivasa 的研究重点是通过更加极端的解决方案来解决这个问题:设计具有硅神经元和突触的芯片模仿真正的大脑。他表示,使用单独的硬件实现深度学习是有道理的,因为通常处理器和内存位于硬件的不同位置,而人类大脑以及深度神经网络的存储和处理是交织在一起的。继语音识别技术之后,人工智能下游的消费应用场景也逐渐丰富起来。

随着微软发布语音助理 Cortana,越来越多的超级应用界面公司意识到,基于人工智能的语音技术不仅是推动用户原有应用界面的背后力量,更可能成为下一代超级应用界面。2014 年获得1300 万美元融资的Expect Labs 成为排名第47 位的“全球50 大最聪明公司”,它基于实时语音语义分析开发的软件通过倾听对话而提供相关信息,最多有8 人可以通过公司的Mind Meld 应用程序同时在线,参与对话。

一些公司在试图模仿、替代人脑,另一些公司则专注于“人机共生”,开发增强人类能力的软件。心理学家计算机科学家J. C. R. Licklider 在1960年发表了一篇预言性文章,开创了“人机共生”这个思考方向。

在“深蓝”打败加里·卡斯帕罗夫的8 年后,两名拥有3 台计算机的美国象棋业余爱好者从巨型计算机象棋大师的手中夺走了2 万美元的奖金。这次,胜利者依靠的不是自身的国际象棋技能,而是一种“人机共生”的工作方式:计算机负责计算,人负责决策

Palantir 是美国加利福尼亚州帕罗奥图市的一家快速成长的软件公司,其目标就是促进“人机共生”。Palantir 的软件让用户工具能够探索互联的数据,并尝试通过视觉来呈现信息,通常用作跟踪人们思考的地图。一家银行购买了Palantir 的软件,以便侦测窃取或泄露敏感信息的员工。监测的信息包括员工何时何地进入地点,以及公司网络上的数字活动记录。相较于自动化系统里是用一个算法根据过去的数据计算出一切,Palantir 这个系统正好相反。Palantir 的创始人在PayPal 工作期间受到“人机共生”理念的启发。原本,PayPal 设计了一个自动化系统来标记欺诈性交易。该系统能够抓住80% 的简单欺诈行为,但是无法应对复杂的骗局。最后,PayPal 研发了一款软件,让操作人员能够追踪剩下的20%的欺诈行为。其通过分析工具洞察大量数据中的可疑活动,而不是等待自动化系统发现。

成立了9 年的Palantir 有美国中央情报局提供的资助,数据分析软件的销售对象包括执法机构、银行和其他行业,并正在扩展到医疗保健新兴行业《福布斯》在2013 年时估计,这家公司的收入为4.5 亿美元。据彭博社报道,2017 年年底,该公司的订单总额可达35 亿美元。

商业上看,“人机共生”或者说“有限”人工智能,成功的概率似乎更高。人们适应了个人生活与智能手机的共生关系,能够在主导权不变的条件下享受更多工具性的助理服务

Palantir 研发负责人Shyam Sankar 和IBM 研究策略总监Zachary Lemnios都是Licklider 的粉丝。Shyam Sankar 认为,分析师只有获得了能让他们从各个角度创造性地检查数据的工具,才能发现这些“灵光一闪”的时刻。ZacharyLemnios 则觉得Licklider 的想法有助于IBM 在“认知计算”方面的研发,包括虚拟助手软件和像大脑一样运作的芯片

这一年(2014 年),亚马逊的表现仍然不起眼。Fire 手机是一次失败。搭载AWS 云计算软件的Echo 智能音箱,也得到一片嘘声。市场和业界还要等两年才能反应过来,并为之叫好。

而沃森尽管在2011 年美国热门益智节目《危险边缘》(Jeopardy !)中打败了最高奖金得主布拉德·鲁特(Brad Rutter)和纪录保持人肯·詹宁斯(KenJennings),但到了2014 年,IBM 投资的10 亿美元只收回不到1 亿美元。通过基于沃森的销售,IBM 获得的收入远低于其每年100 亿美元的长期目标。对于IBM 来说,认知计算是指了解自然(人类)语言并可以通过挖掘所有数据业务面临的所有非结构化数据(如文本和音频)来得出合理结论的系统。而沃森是IBM 在这一领域最大的商业想象,它决心加大赌注。

于是,从事沃森技术的部门将直接向IBM 首席执行官弗吉尼亚·罗梅蒂(Virginia Rometty)汇报。员工人数增加了4 倍,达到2000 人。IBM 还计划将沃森与其他“认知计算”技术结合,并追加投资10 亿美元,大步推进沃森的商业化。沃森首席技术官Rob High 告诉《麻省理工科技评论》,对于向前推进一个更大的投资,“这是正确的时间”。

想让沃森成为可以向企业销售的“认知服务”引擎,就必须添加语音识别图像识别功能。不过,IBM 的问题是,沃森在现实世界中挖掘书面信息和处理自然语言的能力仍未达到理想状态。

IBM 一直希望沃森能够阅读医疗记录并推荐治疗方案,尤其是癌症治疗。如果说参加电视问答游戏是在周末爬爬北京的香山,那么为癌症患者提供对症的治疗建议就是一次海拔5000 米以上的登顶挑战。同时,医生写下的医疗记录充斥着行话、缩略语和不一致的术语,这也给沃森阅读医疗记录带来了挑战。

由此可见,无论沿着哪一条研发路径走,人工智能都不是人人可以参与的便宜的联机游戏。在拥有资本实力的大公司之间,竞争变得白热化,收获却依然很遥远。人工智能如何落地,何时才能为投资者带来效益,相信这个问题很快就能解答。

更多关于人工智能技术创新商业化应用的分析详见《麻省理工科技评论》编写的《未来版图:全球聪明公司的科技创新趋势和商业化路径》。

图书介绍

《麻省理工科技评论》中美编辑部以时间为经、行业为纬,梳理了2011—2017 这7 年195家全球最聪明公司的技术创新和商业沉浮,涉及数10个前沿技术领域,对10余个行业归纳、推演,画出一张融合“科技创新”与“公司商业模式”的路线图。这些全球企业样本技术商业化路径为我们研判科技创新趋势提供了有力的技术支撑。

重磅推荐

“那些有能力将高精尖科技创新与利益最大化完美融合的公司,它们遍布全球,且都有能力抓住新的机遇。”这是《麻省理工科技评论》放眼全球挑选聪明公司的准则,也是这本书要详解的重点。愿这些细致入微的观察和鞭辟入里的分析,能让永远年轻的奋斗者们抖擞精神后,有所思、有所得。


  • 大卫·罗特曼(David Rotman)丨《麻省理工科技评论》主编

我们的年度“全球50大聪明公司”榜单中所列出的企业都是敢于创新,并且其商业模式可以包容这些创新的公司,榜单是我们对未来市场“霸主”的一个预测。当然,善于创新并不能保证它们将成为下一家“超级巨xing”公司。但是,在如今竞争越来越激烈的市场上,善于创新起码会给这些公司一个创造并统治新市场的机会。


声明:本文观点仅代表作者观点,不代表MBA智库立场。
3+1