美国人工智能大牛Yann LeCun是如何炼成的

【编者按】外媒Buzzfeed周二发文介绍了Facebook人工智能团队领头人Yann LeCun。他在上世纪80年代读博期间提出“人工神经网络”,但后来该理论一度被认为过时,他本人甚至被拒绝参加学术会议,直到他在2013年加入Facebook,他的理论才慢慢开始变得热门。

美国人工智能大牛Yann LeCun是如何炼成的

现在,神经网络已经渗入到所有的Facebook产品中,也成为了科技企业竞相研究的领域。

以下为AI世代编译整理的文章全文:

在距离Facebook门洛帕克总部约3000英里之外的曼哈顿中心,有一座米黄色的旧办公楼。在这栋楼里面,一群人正在研究更像是出现在科幻小说中,而不是适用于社交网络的项目。

这个团队是Facebook人工智能(AI)研究团队(Facebook Artificial Intelligence Research)。在Facebook内部,这个团队被称为FAIR。


FAIR专注于一个目标:创造跟人类具有同等智商的计算机。尽管这个目标远远没有达到,但该团队已经取得一些当前很少人认为有可能发生的进展。

他们的人工智能程序可以画出跟人类艺术家的画作几乎没有差别的画,还能完成一些主题限定于维基百科范围内的小测试,甚至会玩《星际争霸》之类的视频游戏。

它们正在慢慢地变得越来越聪明。将来有一天,它们会把Facebook从促进朋友间交流的平台变成可能成为你的朋友的东西。

FAIR不是你想象中的典型Facebook团队。该团队队员不直接研究那些非常受欢迎的Facebook产品:Instagram、WhatsApp、Messenger和Facebook本身。

他们的终极目标可能需要几十年的时间才能实现,甚至有可能永远都无法实现。该团队的领头人也不是你想象中的硅谷成功人士,而是一位曾经在人生中经历过真正失败,然后又奋力东山再起的56岁科研人员。

他的关于人工智能的理论曾经被视如敝履,而现在被认为属于世界级水平。Facebook颁发给他的奖金就是最好的证明。

“您与数字世界、手机、计算机的互动将会发生根本性的变化。”LeCun在谈到人工智能可能意味着什么的时候如此说道。

FAIR正在提高计算机视、听和独立进行沟通的能力。他们的发现正在渗透到Facebook的各个产品中。

从News Feed排序,到相片滤镜,到处都有他们的研究结晶。

Facebook对人工智能进行大规模投资,不仅仅是因为人工智能很有趣,而是因为它不可或缺。在当今科技界的每一个角落,企业们都是在人工智能的基础上进行较量。

Uber的智能自动驾驶汽车是其业务战略的核心。

谷歌(微博)的基于人工智能的Google Home智能音箱可以回答用户口述的问题——在过去,人们遇到问题只能手动输入搜索,或在更久远的过去,只能打开纸质百科全书查询。

亚马逊正在打造只有人工智能收银员的便利店,企图进军市场规模6740亿美元的食品杂货市场。

而在Facebook,处处都有人工智能的影子。举个例子,它的人工智能驱动的照片滤镜正在帮助它击退Snapchat的挑战。Facebook的人工智能能够识别照片里的东西,还能决定向你推送哪些内容。

在人工智能的帮助下,Facebook提供了有趣的用户体验,吸引用户不断再次回头。

同样的技术还被用于监控骚扰、恐怖和色情内容。人工智能可以将这些内容标记下来并清除。

Facebook的应用机器学习(AML)团队负责人Joaquin Candela表示:“人们使用Facebook全系列产品的体验主要取决于人工智能技术。在今天,如果没有人工智能,Facebook就不可能存在。就这样。”

随着该领域不断发展,Facebook需要依靠LeCun及其团队来帮助它走在当前的和未来的竞争对手前面,因为这些竞争对手也有可能拥抱人工智能技术。

在经历多年的批评和忽视之后,LeCun终于拥有了现在的一切:80名科研人员、Facebook的巨大财力支持和大众对他的研究的信任。他现在要做的就是推出产品。


LeCun在曼哈顿

视觉

LeCun在他年轻的时候就相信,他可以让计算机拥有视觉。在今天,面部识别和图像检测已经变得十分普遍。但在20世纪80年代初LeCun在巴黎上大学的时候,计算机实际上是瞎子。它们不能识别照片里的东西,更不知道摄像机镜头里有什么。

在大学期间,LeCun偶然涉足了一种探索人工智能的途径,而这种途径自从60年代以来几乎没有人探索过。他认为,他的研究可以让机器学会完成多种任务,包括感知。

这种途径就是人工神经网络。它研究的是,如何让由小型传感器互联形成的系统把图像等内容分解成非常细小的部分,然后识别出其中的模式,最后根据所有的输入数据确定它们看到了什么。

在阅读了关于神经网络的种种反对观点——难以训练,性能不够强大——之后,LeCun决定推动这项研究。尽管遇到了质疑,但他还是在攻读博士学位期间专注研究人工神经网络。

在谈到这些批评声音的时候,他说:“我只是不相信他们说的。”

人工智能研究经常会遇到困难时期,而且困难难以解决。这样的时期获得了一个专属称呼:人工智能寒冬。

这些时期主要出现在研究人员取得的成果无法达到最初设想之后。

这让人觉得该技术不可行,进一步导致人们对人工智能失去兴趣,投资枯竭,技术进步趋于停滞。

LeCun也遇到过这样的“人工智能寒冬”。在90年代中期加入贝尔实验室从事人工智能研究之后,AT&T的内部矛盾导致了他的团队分崩离析。

当时,他们正在计划推出能读取支票的自动取款机——今天,这种基于神经网络的技术仍在使用中——就在LeCun认为这项技术取得明显进步的时候,他的项目被取消了。

LeCun说:“就在将要取得真正成功的那一天,整个项目被解散了。这真的让人感到非常沮丧。”

与此同时,其他人工智能技术获得了主流研究人员的关注。尽管这些技术后来变得无人问津,但其崛起足以导致神经网络被边缘化。

在本世纪00年代初,其他科研人员甚至拒绝让他在学术会议上介绍他的论文。

神经网络先驱、谷歌的工程专家、多伦多大学教授Geoff Hinton表示:“计算机视觉圈子把他拒之门外。外界的看法是,他在从事在上世纪80年代看起来很有前景的研究,但现在他应该放弃这方面的研究。”

“现在没有人这样看了。”他补充说。

在那个年代,其他神经网络研究人员也遇到了类似问题。

蒙特利尔大学教授、蒙特利尔学习算法研究所所长Yoshua Bengio发现,他很难找到愿意跟自己一起做研究的研究生。“我不得不强迫学生从事这方面的研究,因为他们害怕在博士毕业后找不到工作。”

2003年,LeCun为自己的重生打下了基础。那一年,他成为纽约大学教师,并与Hinton和Bengio结成非正式的联盟,共同重启对神经网络的研究。LeCun面带微笑地说道:“我们开始了我一直称之为‘深度学习阴谋集团’的合作。”

“深度学习阴谋集团”在神经网络研究领域扮演了至关重要的角色。他们坚持最初的信念,认为不需要为每一类检测对象开发专门的神经网络,你只需使用同样的模板开发一个神经网络,就可以检测图像、视频和语音。

换而言之,你没有必要为识别企鹅和猫分别开发一个神经网络,你可以开发一个能够检测两者并能识别其差异的神经网络。这种新的神经网络也可以经过修改胜任其他任务,例如检测声波,识别语音中的模式。

“深度学习阴谋集团”的研究受益于两个重要的外界因素。一方面,计算机性能大幅度提升,这使得神经网络的运行速度变得足够快,从而可以应用于实际。

另一方面,由于互联网的普及,可获得的数据(包括图片和文字)获得了指数级的增长,让神经网络得到足够的训练,变得更加智能。神经网络因此变得更加灵活、快速、准确,给人工智能领域带来了全新的可能性。

得益于LeCun及其合作伙伴打下的基础,计算机视觉在进入10年代初期出现了爆炸式增长。计算机开始学会识别图像中的物体,接着又能识别视频中的物体,最后又发展到能够识别摄像头拍摄的实时画面中的物体。

现在,当你把摄像头指向一个篮球时,人工智能可以知道摄像头前方有什么。LeCun迅速从人工智能领域的边缘人物变为行业领导者。

他表示:“原来没有什么人从事这方面的研究,但在不到一年的时间里,所有人都在研究人工智能。这真是疯了,完全是疯了。”

2013年12月,LeCun加入Facebook。对于有意将人工智能研究应用于图像识别的科研人员来说,Facebook是一个理想的研究环境。

Facebook平台上有数十亿张图像,这给LeCun及其团队提供了用于践行新想法的丰富资源。FAIR团队经常跟AML团队合作,在Facebook平台上将研究成果付诸实践。

这两个团队共同开发新的系统,让整个Facebook公司都能受益于技术的进步。

AML团队使用FAIR团队的研究成果来识别用户News Feed中的内容,或将Facebook的内部内容翻译成其他语言。他们还将这些研究成果应用于Facebook相机,让相机根据用户动作生成各种特效。


FAIR推出的计算机视觉工具SharpMark

思维

教会计算机观察能力是教会它们理解这个世界的运作方式的第一步。人类知道这个世界是如何运作的,原因是我们反复观察了相同的场景,渐渐地知道这些场景将会如何展开。

举个例子,当一辆汽车沿着道路高速地向我们站着的地方驶来时,我们预测这辆汽车可能会撞上我们,于是我们会让开。当天黑之后,我们知道按一下电灯开关会带来光明,于是我们会按一下开关。

FAIR团队正在尝试使用类似的方式教会计算机像人类那样预测事情的结果。LeCun解释说,这个团队正在向人工智能展示许多具有相关性的视频,随后在某个点暂停视频,让机器预测接下来会发生什么。

例如,如果你反复向人工智能系统展示水瓶在人的头顶上倒过来的视频,那么它可以预测,这样的动作会导致有人被弄湿身。

“在某种程度上,智能的本质就是预测。”LeCun解释说,“如果你可以预测你的行为将导致什么结果,那么你就可以做出计划。你可以计划一系列行为,从而达到特定的目标。”

目前,教会人工智能预测能力是这一领域所面临的最棘手的挑战。其主要原因在于,在许多情况下,多个预测结果在理论上都是正确的。

LeCun说,想象一下,你在桌子上方垂直地拿着一支笔,然后放手。如果你问计算机,一秒钟之后这支笔将会位于何处,你不会得到准确的回答。

机器知道这支笔会掉下来,但它无法准确预测这支笔最终会落在哪里。因此,你需要告诉系统,这个问题有多个正确的答案,事实上发生的结果只是多个可能性中的一个。这就是在具有不确定因素的情况下作出预测时存在的问题”。

帮助人工智能理解和接受不确定性是人工智能研究的一个分支。这个分支被称为“无监督学习”(unsupervised learning),是机器学习的最前沿领域。在人工智能进行足够多的观察之后,它会懂得这个世界是如何运作的,并学会预测。

那时,它会开始像人类那样思考,并获得健全的判断力。LeCun认为,这是让机器变得更智能的关键。

LeCun及其团队承认,人工智能完全掌握这种技能还需要很多年的时间。不过他们相信,他们终究会实现这个目标。

LeCun下属的研究经理Larry Zitnick表示:“这终将发生,但我会说,这需要超过10年的时间。”

语音

去年12月,扎克伯格公布了一段视频,展示他亲自动手编程打造的人工智能管家“贾维斯”(Jarvis)。

贾维斯可以给他烤面包,能够在识别出扎克伯格父母的脸之后给他们开门。他甚至还会教他的女儿说汉语。


扎克伯格在使用智能管家贾维斯

这个智能管家看起来非常酷炫。但在LeCun看来,这没什么特别的。

“它主要是用脚本写成的,比较简单。而且,从某个角度看来,它的智能程度很低。”LeCun说道。

LeCun想要开发能够真正听懂你的话语的智能助手。“这是一种能够跟你进行对话的机器。”LeCun解释说,“它们能够实现做好计划,它们不会蠢到让你生气。”

打造这样的机器没有蓝图可依,不过FAIR团队正在研发构建部件。让人工智能对这个世界有初步的理解,并训练它预测这个世界上可能会发生的事情属于其中的一个部件。

利用神经网络教会它阅读和写作是另外一个部件。对计算机来说,一个图像是一串数字。一个口语句子也可以用一串数字来代表,文本也一样。因此,LeCun等人可以使用神经网络架构来识别图像中的物体,语音中的单词,或者文本的主题。

人工智能当前仍然无法像理解图像那样理解文字,但LeCun已经看到未来的贾维斯会是什么样子的。他理想中的智能助手将具有基本判断力,并能跟其他助手沟通。

例如,如果你打算跟朋友一起去听音乐会,你让你的智能助手协调一下,它会根据你喜欢的音乐类型、你的日程安排和即将上演的音乐会向你提供切实可行的建议。

LeCun在形容他面临的挑战时说:“机器需要考虑现实世界的情况,一个人不能同时出现在两个地方,也不能在一定的时间之内从旧金山来到纽约,它还需要考虑出行成本。你需要了解很多事情,才能安排好一个人的生活。”

Facebook目前正在试验一个被称为“M”的简单版本数字助手。这个基于FAIR团队研究成果的项目由Messenger团队运作。

Facebook Messenger最近推出了“M suggestions”(M的建议),让M在认为自己可以提供帮助的情况下加入用户的对话。

比如,当有人问“你在哪里?”的时候,M会弹出来加入对话,向你提供一个一键分享位置的按钮。Facebook未来可能会将此功能扩展到更高级的用途。

M只是Facebook使用人工智能理解意义的其中一个例子。这家公司还在考虑把人工智能技术用于其他用途,甚至可能利用人工智能来打破外界最近指责它帮忙竖起的壁垒。

2016年的美国大选让外界开始关注Facebook上的两极分化和假新闻,然而在此之前,LeCun团队成员Y-Lan Boureau就已经开始研究如何利用人工智能在Facebook上创建更具建设性的对话。

同时研究神经学和人工智能的Boureau曾花一个夏天来观察她的朋友在Facebook上和人互撕,没有一点兴趣听取反对意见,于是她决定从事这方面的研究。

她解释说:“如果我们能够更多地了解他们这种的心态背后的驱动力,理解意见如何形成,如何固化成型,了解他们不能彼此沟通的原因,这将是一件大好事。”

Boureau想创造这样一个世界:在人们付诸行动之前,可以看到尽可能多的不同意见。

人工智能可以帮助我们从文本中找出模式,理解哪些环节出了问题,并找出办法让偏离轨道的对话回到正轨。

“如果我们能够通过数据进一步了解对学习过程以及人们的信念是如何形成的,那么我们就能够知道怎样才能进行更多的具有建设性的对话。”Boureau说道。

在2016年美国大选之后,LeCun公开表示,Facebook有技术能力使用人工智能过滤假新闻。有人觉得这种方式还可以用来解决美国的两极分化问题,但LeCun称这个任务最好还是留给第三方解决,而不是交给可能存在偏见的机器。

现实


对人工智能来说,炒作周期可能会引起危机。LeCun深知这一点。而现在,我们似乎就处于这样一个周期。

在2013年第一季度,只有6家公司在其财报电话会议上提到人工智能。根据彭博社的数据,这个数字在2017年第一季度增长到了244个。

在谈到人工智能的未来时,LeCun措辞非常谨慎。他说:“人工智能离我们的目标还非常远,还达不到我们想要的效果”。事实上,正如LeCun警告的那样,人工智能还远远达不到人类的智力水平,即所谓的通用人工智能。

然而,有时候LeCun也无法抑制自己的热情。让他感到尤其兴奋的是对抗性训练。这是一种相对比较新的人工智能研究领域。有助于解决当前人工智能领域面临的预测和不确定性挑战。

对抗性训练让两个人工智能系统互相对抗,从而让它们更了解真实世界。比如,在FAIR团队的一个实验中,研究人员让一个人工智能系统画画,并骗过第二个人工智能系统让其以为这是人类画的,第一个人工智能系统接着利用第二个人工智能系统的反馈把画画得更好。

在今年早些时候的一个会议上,LeCun展示了一些更先进的东西:第一个人工智能试图让第二个人工智能相信,它创造的一段视频中几幅画面属于后者已经看过的一个视频中的一部分。LeCun表示,对抗性训练“是机器学习领域过去10年或者20年来最棒、最酷的想法。”

LeCun会继续研究对抗性训练,再一次把人工智能研究推向新的极限。他一路走来,从20年前默默无闻的年轻研究员变成现在人人仰慕的大牛。

尽管LeCun会第一个告诉你,对人工智能的研究远未结束,成功不属于他一人,但他无法让你不欣赏他。

“我不能说这种感觉很糟糕。”他说,“这种感觉棒极了。”【责任编辑/刘凯】

注:本文转载自腾讯科技,如有侵权,请联系我们

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
AI时代已到 人工智能将革新人机交互新场景
江西将重点打造10个人工智能和智能制造产业基地
聚焦AI基础服务 “AI+云”加速传统行业落地
向20多家公司投资收集数据 软银孙正义坚信机器将比人聪明
网友评论

精彩评论