首页 >> 最新文章

认知革命的里程碑AlphaGo20全局观棋风稳健强人工智能未来可观腈纶滤布

2020-04-24 15:12:51 腈纶滤布    

AlphaGo之父哈萨比斯是一个绝顶聪明的人,他从4岁开始下象棋,很快成为天才少年。8岁时就思考人脑如何完成复杂的任务。在本场比赛开始前的开幕式上,哈萨比斯就为此次比赛定了调。他说,“AlphaGo的本质是人类利用电脑发现新知识,人们利用哈勃望远镜发现新的宇宙空间一样。就像我们的最终目的不是输赢,因为不管如何,最终的胜利终将属于人类。让我们一起寻找围棋的真谛。”

为什么计算机下围棋非常困难?这是因为其复杂程度让穷举搜索都难以解决,这个难题包括两个方面,一是“不可能”写出评估程序以决定输赢,另一个是搜索空间太过庞大。更困难的是围棋不像象棋等游戏靠计算,而是靠直觉。围棋中没有等级概念,所有棋子都一样,围棋是筑防游戏,因此需要盘算未来。你在下棋的过程中,是棋盘在心中,必须要预测未来。小小一个棋子可撼动全局,牵一发动全身。很多艺术都是主观,AlphaGo把围棋看做了一个客观的艺术,每一步都会分析有什么影响围棋“妙手”如受天启。

AlphaGo学习了3000万步人类棋谱,走棋风格也近似于人。而AlphaGo2.0脱离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。而AlphaGo2.0会不断制造这样的局面,关键他还是对的。我们会津津乐道,AlphaGo是什么棋风。但可以这样推理:但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0便会是这么一台机器,没有风格,稳如磐石,比人更能避免陷入局部利益的狭隘计算,进而表现为能够走出看似难以理解但是实则韵味无穷的落子,只因每一步都是朝着全局获胜的目标前进的。

AlphaGo 1.0是巧妙地混合了蒙特卡洛树搜索+监督学习+增强学习三种算法。根据公开资料推测,此次AlphaGo2.0的技术原理与之前有着巨大不同:

1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。

2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。

3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。

在这样的算法下,AlphaGo 2.0对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个GPU工作,每一步棋消耗的能源接近人的大脑。

DeepMind已经在尝试让AlphaGo有“举一反三”的能力,这种触类旁通的能力才是人类更为擅长的,这里就要用到迁移学习领域的技术。DeepMind的愿景是研究何为AI,然后再用智能解决所有问题,即怎样提出有效的建议去解决问题,最终希望建立通用人工智能。也许就是因为这种进步,DeepMind将开始探索人工智能在医疗等各个行业领域的应用。

以AlphaGo为代表的人工智能应用,在这场认知革命里只是一个小小里程碑。工业革命实现了体力工作自动化解放了体力劳动者,认知革命将知识工作自动化解放脑力劳动者。人机合作可以达到1+1>2的效果,人类的智慧将被人工智能放大。人工智能和AlphaGo都是工具,就像哈勃望远镜一样,可以推进人类文明的进步。无数其他领域也将遭到组合轰炸,强人工智能也是我们探索的最好工具,比如将AI用到材料设计、新药研制上,还有现实生活中的应用,如医疗、智能手机、教育等。

电子材料试验机

人造板万能试验机

万能试验机

友情链接