张峥：AI与人脑如何对比？至少先从“中国屋”到“中国房”

微信图片_20190121122618_meitu_1.jpg

导读：日前，文汇报刊发了报道《人工智能时代的“厂医”来了》，在上海一些产业园区，“一分钟诊所”为企业员工提供健康服务，既方便他们看病，又提高了工作效率。AI的应用范围越来越广，那它离人脑还有多远？AWS中国人工智能研究院首任院长、上海纽约大学计算机科学教授张峥（文汇讲堂第100期嘉宾）在近日在相关演讲中，试图探讨人工智能跟人脑的鸿沟在何处。

人工智能现在之所以井喷，因为到了一个时间点能把很多学科揉在一起，比如AlphaGo在围棋背后的所谓强化学习，其概念发端于一百多年前的心理学。其成功包括很多学科的支撑，比如脑科学、计算机科学。其中有很多无形推手，作用并不直接，比如互联网、数码技术——假如没有互联网、数码相机就没办法收集和标注数据。还有一个因素是很多商业应用。有很多看得见摸得着，像自动驾驶、人脸识别、机器翻译等等。但是我觉得更大应用是隐藏在幕后，比如在车间里、流水线上，也就是说工业4.0。我自己认为这方面的应用要打开才是好事情，才可以把生产效率提上去。

让机器的脑有结构是关键

人工智能的背后有一个深度学习的方法在起作用，深度模型作为一个函数，哪部分是“脑”，为什么？在这一点上，我跟不少神经科学家有分歧，有的神经科学家觉得神经元是最关键，人工智能的神经元应该跟脑一样，需要用脉冲信号；也有的说优化的方法必须和人脑的学习方式一致。我觉得这些都不是本质，更关键的是函数的形式是什么，或者说网络的高层结构式是什么。

给大家举一些例子，有很多计算机学家做的工作是架构师，就是设计不同网络的结构，底层是神经元，但是可以分成不同的模块，不同的网络的架构会不一样。就像人居住的环境，地上打一个草席、到酒店、住高楼，虽然都是睡，但结构不一样，这个结构最关键。我觉得是这个结构本身跟人脑之间的关系要搞清楚。

可假如我们问脑科学家，比如说一句话，哪些脑区是联动的，之间的逻辑和先后次序是什么，计算过程是什么，他们是不是很清楚呢？在上海我主持一个项目，自然语言处理在脑科学和人工智能之间的联合研究项目。启动调研的时候，我问，比如说看到桌子上有个苹果，那么说出这句话，人脑是如何做到的，我以为他们（脑科学家）一小时之后就能告诉我，结果花了一天给了我一个草案，其中有很多的猜测。

脑科学也在探索，还有很多未知领域，既然有那么多未知，我们怎么和人类智能比较呢？挺困难。但是我们可以猜，我们可以从其他角度来看这些问题。比如现在机器翻译相对成熟，但结果还不好，你可以似懂非懂地猜。那么，我们人类是怎么犯错的呢？人类犯的错挺有趣，关键在于人类犯错和机器学习犯的错不一样。两个系统犯错一样不见得他们背后的工作原理是一样的，但是假如说犯错不一样，那么原理一定不一样。这可以启发我们怎么设计这个机器。

结构是“中国屋”的模型，是不拥有所谓理解的能力的

再比如说诗歌。现在有很多写诗的软件，举一些我们出色的诗人写的诗歌，比如里尔克的这首“羚羊”，里面有一句写道：To see you: tensed, as if each leg were a gun loaded with leaps. 这是描写羚羊跳跃的敏捷，他说羚羊的腿像一把枪，装的不是子弹，是跳跃，来形容动作之快，非常形象。

小冰_meitu_2.jpg

2017年5月19日，机器人小冰在北京举办了她“个人”第一部原创诗集《阳光失了玻璃窗》新书发布会

我的一个诗人朋友王小龙，他的这首《爱的十四行》情诗，说“我要在海边盖一座房子，亲爱的，一座盐粒堆成的房子，我要的就是通体纯蓝……” “通体纯蓝”这四个字大家琢磨一下，非常有趣：盐会想到提炼，用纯这个字非常对，说海，我们会想象到蓝，这句诗让人觉得想象非常自然。读诗读多了，你会发现意向的跳跃和连接非常有趣，显然我们现在机器学习出来的诗句没有这个能力。

我们反过来看一看，机器学习里面的结构是什么样的。比如机器学习的翻译模型，就是一串词进去，一串词出去。大家知道，在图灵测试之后有一个思想实验叫“中国屋”，就是讨论机器到底是不是理解句子。机器把一个词拿过来，字典翻一翻，找一个词吐出去，叫“中国屋”。“中国屋”，或者结构是“中国屋”的模型，是不拥有所谓理解的能力的。

我们起码要做到“中国房”。我曾打趣说，三、四十年前，中国屋和中国房是一回事，因为大家都挺穷。但是现在“中国房”走进去有各种各样的房间，承载不同的功能，有卧室、厨房、卫生间等等，有层次、有结构。如果我们的模型是一个扁平的结构，那就是中国屋。我们起码要做成有层次结构、有功能分块的模型，只有那样，才有希望跟人脑去进行对比。

在这里，我们也可以从其他地方得到一些启发。有一个印度小伙子，他做了一件非常了不起的工作。他发现自闭症的孩子在说话的时候有些词吐不出来，比较抽象的词，比如动词，经常说不出来，所以不成句。他观察到，自闭症孩子妈妈引导孩子说话，来理解孩子的意图，是用提问来引导的：比如说吃饭，吃什么？和谁一起吃？什么时候吃？他就做了这么一个游戏，训练自闭症的孩子来产生句子，每个时间点都是可以正生长的图，这就很像人来生长句子的过程了。比如“他来我也来”这种带有主从关系的套句，可以有不同的次序来生成。人说一句话，有各种丰富表达的可能性，这也是语言的魅力，我们现在人工智能远远没有达到这个地步。

微信图片_20190121122626.jpg

张峥指出，人工智能的艺术创作也已经做到了以假乱真的地步

对于不擅长的东西，人类可以目送人工智能做得越来越好

我觉得连接人脑和人工智能的桥梁是有可能的。但是要这么看，就是脑科学底层有一些做基因、做神经元、神经电路这些工作，对理解人脑、保护脑非常有作用，但和人工智能的关系并不直接，也不一定对人工智能有特别大的启发。因为底层的可以用神经元做，也可以用其它器件做。但是，还有一些是更高层的、功能性的、系统层的工作，尤其神经心理学、神经哲学这些新的学科，对人工智能的发展至关重要。

同样的，人工智能也可以分成两种，一种存在于人机交互的界面。一张图片包含什么信息，一句话在说什么，机器不能瞎猜，机器理解的过程至少跟人脑的认知计算的过程保持一致。也就是说，在人机交互的这些功能上，比如理解人的语言、理解人的知识、理解图片、以及各种交互功能，我觉得我们没有选择，我们必须要去理解大脑认知计算的过程，用它作为一个指导来做我们人工智能的东西。如果这个过程不一样，那么即使看上去一样，但实质不一样，犯错都不一样，就提不上真正的，能和人紧密接触的智能来。这是非常基础也非常重要的工作。

人工智能的另外一部分我索性叫做“累脑”，为什么呢？因为在人类那么长的进化过程当中，大部分的环境是相对简单的。大脑还没有足够的时间和压力来发育出比较成熟的功能来应对一些比较复杂的任务。比如概率、统计等等，大家学习的时候会普遍觉得比较累，比较“抽象”。这些问题，本质上是数学问题、搜索问题，就像下围棋，这些问题，人类对付起来天生比较吃力。

对这一类型的人工智能，我觉得我们应该放松，不必要拘泥于大脑的结构，我们应该目送AI远去，希望它在一马平川上飞奔，做得越来越好。把我们本来也不擅长的任务交给人工智能，让它发力，这样反而可以解放我们人类。

作者：张峥

编辑：袁琭璐

责任编辑：李念

来源：知识分子