人机融合的未来-寻找“棋盘上的真理”
——YOCSEF人机大战特别论坛总结

  这篇文章是根据3月13日上午我和白瑞雪共同担任执行主席的CCF YOCSEF特别论坛“ 围棋人机大战:人类输了吗?”的嘉宾发言和讨论整理而成,同一天下午AlphaGo对阵李世石的第四场,形势出现逆转,李世石赢了强大的人工智能围棋程序。尽管最后第五场比赛还未开始,输赢其实并不影响这篇文章要讨论问题的观点 - 我们关心的不是输赢,而是如何理性探讨人类和机器的未来。

  这是一次非常精彩的论坛,我们请来了国内在深度学习,人工智能和认知科学领域知名的专家,包括地平线机器人创始人CEO、机器学习专家余凯,清华航天航空学院计算力学副教授、清华围棋基金秘书长由小川,NovuMind公司创始人兼总裁、计算人工智能专家吴韧,CSDN(中国开发者网络)创始人、极客帮创始合伙人蒋涛,中国科学技术信息研究所研究员、认知科学专家张寅生,以及中科院计算所研究员、副所长陈熙霖。在进入观点的探讨之前,我想要感谢我的共同执行主席白瑞雪和整个YOCSEF主席团,这是我们第二次搭档以“集结号”的方式临时邀请特约讲者,第二次在正式论坛的头一天晚上才能碰头,我从外地会议上飞回北京直接去会场和她过第二天的流程,她的默契和专业能力保证了这次论坛的成功,各位读者在下面可能看不到她的身影,还有幕后整个CCF YOCSEF团队的智慧,才使得这次论坛的观点形成互补有机的整体,并且激发出智慧的火花。回到自己,很欣慰这次把自己放在纯粹的提问,支持和激发者的位置,没有表达自己的任何观点去影响讲者的流程,却能够狭带从我参加果壳网和优酷直播两场比赛中提炼出来的问题当私货,余凯评价说是非常好的问题而将讨论引入深层次。在讲坛开始之前,我们基本上可以把AI的历史用下面一张图总结 - 这张图是我根据YOCSEF一次论坛讲者云之声CTO梁家恩的图稍加修改做的,放在了准备的群里,对认识AI的发展有一个大局观:

  我的目的很简单,科学思维,常常需要思考和问不合常规的问题,得到违反我们直觉和常识的结论。而只有从新的数据和试验,观察得到的这些新的,不合常规思维的结果,才是推动人类认识新的知识 - 纯粹思辨是获得不了什么新知识的,顶多是现有知识的另一种描述。这也是写这篇文章想保持的初衷,因为谷歌的AlphaGo围棋程序和围棋世界冠军李世石的四轮大战3:1的结果,引发各界的争论中,很多是基于“机器怎么能战胜人类智慧?”的理念,而不是客观的理性分析,这次YOCSEF特别论坛,我们看到的恰恰是理性,更多的理性。虽然,我将尝试综述之:

  我们请第一个讲者余凯把AlphaGo背后的算法和人工智能,深度神经网络讲清楚。余凯本人在百度时就是深度学习方面的科学家,后来创业专注于智能机器人芯片和系统。他总结了过去10年深度学习的要点,是集中在“知”方面,就是感知和认知,所谓感知是对信号做处理理解他们意义,认知的话是对知识表示跟推理。通过深度学习的神经网络,去实现各种模式识别,图像的,语音的,棋谱的,这些都是“知”的层次。这次AlphaGo用的也是卷积神经网络CNN达到多维度的认知,然后这次AlphaGo算法的突破,就是通过增强学习来建立“行/Action”的模型,做到了“知行合一”。余凯博士讲的增强学习框架,就是决策,世界和奖励的三元关系,是一个类似于“条件反射”的封闭体系,AlphaGo做出一个决策/action,然后影响了棋局/World,然后根据棋局和对手回馈一个输赢的概率/rewarding. 这是个优化目标函数引导系统自学习的过程。余凯详细讲了策略函数和价值函数,策略函数是我怎么下棋,下一步棋应该在整个棋局怎么下,而我针对这样一个棋局怎么样评估这是价值函数 - 这个就是大家提到的“棋感”。AlphaG算法它的本质是用深度神经网络去描述这个价值函数,然后用另外一个神经网络去描述这个策略函数。除此以外的话其他的创新其实基本上都不能算是本质上的创新,包括MCTS就是MonteCarlo树搜索。围棋的难处在于19×19带来的棋子下一步的巨大的状态空间,超越了宇宙的原子数。另一个来自于无论是价值函数,还是策略函数都是极端不连续的函数,一个“昏招”或者“奇招”都会带来整个评价系统的巨大变化。余凯博士的讲解,是把核心的数学公式进行了拆解,让搞理工的专业人士听得如醉如痴,下面这个图不是余凯的,是卡内基梅隆一个韩国博士生总结的,很好的表达了这个学习和评估的过程:

  在余凯专业的“知行合一”算法分析之后,异构计算的科学家吴韧用一种特别适合“算法小白”听众理解的方式,把AlphaGo的人工智能,用“猫狗大战”的比喻作了深入浅出的阐述,我注意到到场的两个小学生棋手,眼睛都亮了,过后果然反馈了正确的理解 - 老朋友吴韧和我的合作都是在HPC异构计算方面,这一次他的科普水平让我们大开眼界。从ImageNet的深度神经网络从互联网上成千上万的猫的图像中无监督地学习到“猫”这个图像 - 吴韧比喻AlphaGo-阿法狗其实是一只”热狗“,它是由三种超级狗组合的: AlphaGo热狗=一只本能狗+一只数钱狗+一只摸黑狗,本能狗就是靠深度学习卷积神经网络,通过棋局训练它知道这一步,该走的下一步的各种可能,这是CNN学习到的本能;数钱狗就是对价值函数进行做增强学习,就是培养Go的感觉,看到这个牌面告诉我走哪步棋,看到这个东西告诉我值多少钱; 摸黑狗就是对事情不清楚在黑灯瞎火怎么做,就是说你用很多不聪明狗来回跑的时候,这个你会找到这个正确的路径要用概率的思想,就是用MonteCarlo树搜索算法 - MCTS。而这三种狗背后,是培养它们的强大的狗窝,就是计算机集群和异构计算GPU。吴韧创立的NovaMind就在开发异构计算框架下的围棋程序,叫做异构神机,将在几个月后挑战另一个人类冠军,让我们试目以待。吴韧博士认为围棋智能是人工智能研究的副产品,而计算能力是人工智能研究的驱动力,人类无需担心单一人工智能能力机器超越人,因为这是计算力的必然结果,而多种能力的综合才是最要紧的,这个目前基本上人工智能还做不到。

  两位计算智能方面的专家基本上把谷歌的AlphaGo为何如此强悍讲透了,深度卷积神经网络,增强学习和MCTS算法的软件加上上千颗CPU几百颗GPU的计算能力,再加上关键的是即可从人类的高手对弈棋局中进行学习,又可以自我对弈增强学习 - 机器的“最强大脑”终于从神经网络的黑箱中,提取出了能够战胜人类冠军的“暗黑棋力”!来自清华大学的由小川老师,作为既是象棋也是围棋的爱好者,从这场人机大战对围棋界的冲击谈起。先是回顾了围棋界初学者,业余段位和职业棋手三种分级标准,回顾了围棋程序几十年来的发展,可以发现深度神经网络的引入的确是棋力革命性突破的关键。他指出,很多专业棋手都发现,这次AlphaGo建立在逻辑计算上的招数,“局部棋行和人类下的很像,但是在某些时刻,在外面棋子很远地方配置不一样的时刻会走出创新型招法,在人类棋手第一感,这是曾经被我们推翻的招法,或者俗称所谓的臭棋,在这种配置下会成为好棋,结果也证明计算机是好棋,这个在人类是太难了。”回顾中国象棋被电脑颠覆后的历史,他认为人工智能在围棋上的突破,将帮助人类在寻找围棋界的终极问题“棋盘上的真理” - 就是绝对的最优解将有划时代的意义 - AlphaGo出现之前,人类世界冠军距离“棋盘上的真理/围棋上的上帝”有多远,比较统一意见在三子到四子左右。但是机器棋手的新的招数和走法布局,使得这个问题突然有“破碎虚空”的效果,将这个问题的边界又推进了多少?

  如果我们把眼光放得更远一点,暂时从围棋上移开,就是CSDN创始人极客帮创始合伙人蒋涛讲的话题,就是人机大战后的商业思考 - 蒋涛本人也是围棋爱好者,提到当年的两位大师吴清源和另一位的判断,他们离“围棋上帝”应该差5-6手的距离,现在深度学习的对战结果,使得这个距离,可能会被拓宽很远。作为一个投资人,蒋涛分析了Google近期相关于深度学习的项目达2700多个,AlphaGo的胜利,将在很多的领域带来实用,DeepMind已经宣布了进军医疗领域-我们可以想象中医古代的“望闻问切”的经验式治疗,实际上是可以通过大量的病例通过深度学习的方法,找到隐藏在大数据深处的隐藏知识,就如同AlphaGo下的种种妙手。和人工智能相关的技术,自动驾驶汽车,VR/AR技术,机器人的近期突破,都表明我们进入了一个“人工智能+”的时代,投资界和科技界应该对此引起足够的关注。特别是人工智能领域,我国学者在全球的贡献,包括华人的贡献,应该更快地转化为生产力和工业界结合。

  对于人工智能威胁论和对这次人机大战的优劣,中国科学技术信息研究所研究员张寅生的结论非常清楚,这是“another”机器对人的超越而已,就像汽车超越马车和人类的双足,计算器超越人的心算。但是深度学习的这次胜利,再一次讲人和机器的边界变的模糊,未来人的越来越多机能,包括情感,欲望和心理活动,只要能够在输入输出上被机器所实现,“人即机器”这一个论断,至少目前来讲,不能说是错的。AlphaGo讲48个维度的知识切片,通过12个卷积神经网络的中间层进行“黑箱学习”,也许就是我们大脑的工作方式?而非图灵计算和认知科学的投入,将是未来的方向。

  讲座后的Panel环节,精彩纷呈,特别是陈熙霖老师和余凯,吴韧对机器智能能走多远的讨论,为节省篇幅,我试着将暂时的结论总结如下:

  机器智能是一种直觉智能,就像爱因斯坦提出E=MC^2的直觉,这种直觉是可以通过黑箱的深度神经网络得到的。而机器智能颠覆的新的棋局和棋着下法,又反过来促进人类的新的学习,重新思考过去疏忽的棋局和下法。机器不存在哪个招是“昏招”的判断,它依据的是算法。就像新司机是背交规,而老司机是凭讲不出的经验 - 未来并不是所有的围棋的下法都如人类能事后分析出显式的逻辑和理由,就像这次有些AlphaGo走的实现的“昏招布局”若干步后是绝好的配合一样 - 机器学习搜索到深度,超越了人类,而且还不带有人类的情绪和懒惰带来的缺失。也许未来,人类必须通过机器智能的发展而共同进化。而大家提到的AlphaGo背后巨大的能耗和人工智能的效率问题,当年我们的计算机不是从一个屋子大小,变成手掌大了吗?这个问题会逐渐解决。

  精彩的讨论实在太多,篇幅和时间关系,没法逐一展开。好在我们此次做了全程电视摄影,关心的朋友可以关注YOCSEF公众号跟进。

  我自己的感受,东方发明的围棋和几千年来人类棋手在围棋上的精妙棋谱,是机器智能最重要的智慧源泉,人类创造了灿烂的文明,并通过一种新的人工智能的方式将这种文明进一步拓展,人类的未来,将会随着人工智能的发展而得到革命式的飞跃 -当然,技术本身无善恶,就像武器,到底最后还是看使用它的人。

  

Comments are closed.

Baidu
map