阿法狗再学新技能 不到一天国际象棋达世界冠军水平

作者:冬小麦点击:5144417-12-08 09:39

阿法狗再学新技能 不到一天国际象棋达世界冠军水平

阿法狗GET新技能

腾讯体育12月8日讯 近日,AlphaGo研究团队提出了AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到24小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练3天时间的AlphaGo Zero。

对于DeepMind来说,其最终目的远非在棋盘游戏中击败人类。他们希望可以打造出一种通用人工智能,解决更多的人类问题。虽然距离这一圣杯还很遥远,但是这周展示的最新研究成果显示,他们正走在正确的道路上。

阿法狗再学新技能 不到一天国际象棋达世界冠军水平

在其发表的文章中透露,最初攻克围棋的AI程序的后代自学了许多其他游戏,均达到超人水平。经过八个小时地自我练习,击败最初战胜人类围棋冠军的AI程序,再经过四个小时的训练后,又击败了当前世界国际象棋冠军程序Stockfish。更令人惊讶的是,仅经过两个小时的训练后,就战胜了世界最顶尖的日本将棋程序之一的Elmo。

可以说,AlphaGoZero是这个星球上最强的围棋选手,没有之一,而现在根据其学习速度很可能成为这个星球上棋类运动的真正“一哥”。

在几十年中,顶尖计算机科学家都相信,由于国际象棋历来被视为人类智慧的象征,因此,一个强大的计算机棋手也很快会在所有其它能力领域超越人类。但事实并非如此。一部分原因在于人类认知与机器认知的差异:计算机可以轻松执行在人类看来极其困难的计算任务,但却完全无法胜任人类凭直觉就能做到的常识性任务。

还有一部分原因在于产业界和学术界在上世纪八、九十年代的发展选择:为了快速获得结果,实验室放弃了基于学习、可通用化的方法,为了利用机器的计算速度,选择了难以扩展的硬编码解决方案。

不过,随着AlphaZero的横扫无敌,那些国际象棋大师们确实应该感到紧张,因为AlphaGo要是不能跑到星际争霸2里去虐人,就只能继续找他们下棋啦。

(冬小麦)

网友评论(2条)
取消