日前,《麻省理工科技评论》刊文评选了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。什么是对抗性神经网络?为什么它能选入MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?需要应用于在人工智能的哪些场景?还有哪些关键问题尚待攻下?中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在拒绝接受科技日报记者专访时做到了深入浅出的说明。
故事中的GAN幻影张军平告诉他记者,虽然GAN是科技领域的“富二代”,但只不过在很久以前的中外小说中就能看见这个点子的影子。这个点子最先可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《国际象棋的故事》。在该小说中,主人公B博士被长年拘禁在纳粹集中营中。
在想方设法了各种挣脱空虚和寂寞的办法却徒劳无功后,B博士车祸获得了一本国际象棋棋谱。他腹完了书里的上千棋谱后,用送的面包做到了副国际象棋,开始自己跟自己对局,最后演变一盘相接一盘的互相可怕挑战,这令其他棋力大上涨。入狱后,在一艘游艇上,他竟然精彩地在首盘就打败当时的世界冠军。
在中文小说里也有类似于的影子,它经常出现在金庸写于1957年的武侠小说《射雕英雄传》中。王重阳的师弟周伯通被东邪“黄药师”受困在桃花岛的地洞里。为了去找时间,周伯通就用左手与右手打人,自娱自乐。
其武功决窍在于要再行“左手画圆、右手画方”,迟疑二用,确保可以同时施展两种武功,从而使得武力大幅提高。这两部小说主人公功力大幅提高的关键都是“自己跟自己对决,企图倾尽全力打败对方”,而结果都是剑法后,去跟高手过招时能精彩秒杀输掉。
用一句俗话来说明,叫“双拳难敌四手”。让机器学会“左右互搏”GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。一个网络中有两个角色,修练的过程中左手扮演着攻方,即生成器(generator),企图分解和大自然世界中白鱼已完成任务充足相近的目标;右手扮演着守方,即判断器(discriminator),企图把这个骗的、分解的目标和现实目标区分出去。
经过重复多次双手互搏,左手右手的功力都会大幅提高,从而超过“舍我其谁”的目标。明白这个道理,就难于明白为什么GAN网络一出,就有独孤求败的感觉了。正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用于场景是针对图像涉及任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提高一个档次。
不过,必须留意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用于中,它要用了自己千锤百炼出来的生成器,就获得了十分好的结果。于是,自2014年GAN网络被IanJ.Goodfellow等人明确提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延到。
在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度自学知名会议ICLR上,光读与会论文的标题,就能找到大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处置、语音辨识、智能驾驶、安全监控……或许GAN早已无所不能了。
张军平用几个较为火的人工智能应用于场景举例——在年龄估算中,GAN能通过攻防互搏,基于等价的人脸图像构建对其人凋亡或年轻时的样貌分解。在多视角人脸识别、横跨视角步态辨识领域,使用类似于的机理,构建对人脸角度和步态角度的自动转动,从而有效地提升了多视角、横跨视角人脸和步态辨识的精度。
在自动驾驶领域,必须对智能汽车展开简单环境下的虚拟世界训练。此时,就可以利用GAN来构建与实际交通场景产于完全一致的图像分解。具体来说,可以再行给GAN输出一张随机噪声图像,通过其生成器来最小化与现实场景相似的图像,同时判断器最大化分解场景与现实场景间的差异。经过重复递归的攻防博弈论,从而取得与现实环境完全一致的交通场景。
“不光在应用领域下有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更加多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方替换成其他东西或者所谓的函数或结构来互搏。
但万变不离其宗,内在的机理是恒定的。”张军平补足道。
GAN有什么“软肋”“毫无疑问,这种可大幅提高‘功力’的技术选入MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术依然有较小必须提高的空间。
”作为《IEEEIntelligentSystem》(智能系统)和《IEEETransactionsonIntelligentTransportationSystems》(智能交通系统)等知名期刊的编委,张军平对GAN的“软肋”了如指掌——首先,对付很差是更容易出有问题的。比如那位B博士。
国棋国际象棋的世界冠军在觉察到他的反感烦躁与迫切情绪后,就有意识地减慢对局速度。结果所致了B博士的精神分裂,使得他再度陷于迷茫的自我对局之中,最后才幡然醒悟而道别了棋局。对付网也是如此,稳定性仍然是其不存在的问题之一。
尽管理论上WassersteinGAN(WGAN)可以部分解决问题其收敛性问题,但实际的效果还没超过尽人意的地步。其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不几乎报告,或许早已有十五波“武林高手”对GAN网络的抗击打能力展开了挑战。
极端情况,在图像中加一个像素就有可能使GAN网络产生失误。第三,GAN网络也是深度网络的一种,在可解释性这条路上,依然没寻找十分具体的方向。最后,双手互搏的基础还是手。
而这一基础的结构并没从近几十年来人工智能发展的框架中瓦解出来。因此,张军平警告,希望以GAN之奇技,从很弱人工智能冲击“能确实推理小说和解决问题,且有感官、有自律意识的”的强劲人工智能还遥遥无期。
本文来源:yabo手机版登录-www.tsshx.cn
Copyright © 2008-2023 www.tsshx.cn. yabo手机版登录科技 版权所有 ICP备77138640号-7 XML地图 网站模板