AlphaZero令国象重具艺术性
国际象棋一向以冷酷的逻辑著称,但弗拉基米尔·克拉姆尼克却因其魅力而热爱这项运动。
“这是一种创造,”他说。他对棋局上思想冲突的艺术感、复杂而优雅的挑衅和反击的热情,帮助他在2000年击败加里·卡斯帕罗夫(Garry Kasparov),并成为数年的世界冠军。
然而,去年从国际象棋比赛中退休的克拉姆尼克也认为,他心爱的这项运动已经失去了创造性。他将此部分归咎于计算机,因为计算机无情的计算创造了大量的开局和防守,一流的球员都熟悉这些。克拉姆尼克说:“在相当多的最高水平的游戏中,一半的游戏——有时是整个的游戏——是在内存中进行的。”“你甚至不用自己做准备。”
近日,克拉姆尼克提出了一些关于如何在世界上最强大的国际象棋计算机的帮助下恢复人类象棋艺术的想法。他与Alphabet人工智能实验室DeepMind合作,后者的研究人员向他们的超人棋类软件AlphaZero发起挑战,以学习9种国际象棋变体,这些变体可以让棋手产生创造性的新模式。
在2017年,AlphaZero展示了它可以通过自学彻底打败国际象棋、围棋或日本围棋高手。Kramnik说,最新的研究结果表明,如果人们愿意对现有的规则做出一些小的改变,国际象棋将会有新的诱人的前景有待探索。
该项目还展示了象棋玩家和机器之间的协作模式。“国际象棋引擎最初用来击败人类,”Nenad Tomaev说DeepMind研究员曾参与该项目。“现在,我们看到像AlphaZero这样的系统被用于与人类合作进行创造性探索,而不是与人类对立。”
人们下国际象棋已有1500年的历史,对规则进行微调并不是什么新鲜事。也没有人抱怨电脑让这个游戏变得无聊。
前国际象棋世界冠军弗拉基米尔克拉姆尼克(左)与杰米斯哈萨比斯(右)创立的Alphabet旗下的DeepMind合作,探索使用人工智能的新型国际象棋。
国际象棋在大约500年前迅速传播,当时欧洲棋手将一种移动缓慢的棋子提升为现代强大的王后,这给了这个游戏更多的活力。1996年,也就是IBM的“深蓝”击败卡斯帕罗夫的前一年,国际象棋神童、现逃犯鲍比菲舍尔(Bobby Fischer)在布宜诺斯艾利斯召开了一场新闻发布会,抱怨国际象棋需要重新设计,以降低电脑强化记忆能力,鼓励创新。他推出了费舍尔随机国际象棋(Fischer Random Chess),这种象棋保留了通常的游戏规则,但随机化了每局棋盘背面强大棋子的起始位置。菲舍尔随机牌,也被称为960象棋,慢慢地在国际象棋世界中赢得了一席之地,现在有了自己的比赛。
DeepMind和Kramnik发掘了AlphaZero从零开始学习游戏的能力,以比人类几十年或几个世纪的游戏更快地探索新的变种,人类的游戏会揭示出它们的美丽和缺陷。“你不想投资数月或数年的你的生活想玩的东西,只有意识到,“哦,这并不是一个美丽的游戏,“”Tomaev说。
AlphaZero是AlphaGo更灵活、更强大的继任者。2016年,AlphaGo打败了围棋冠军,在人工智能历史上留下了一个里程碑。它开始学习一个只有规则、记分的方法和一种预先设定好的尝试和胜利的冲动的游戏。参与该项目的另一位DeepMind研究员乌尔里希帕奎特(Ulrich Paquet)表示:“当它开始玩的时候,它的表现非常糟糕,我都想躲到桌子底下。”“但看到它从虚无的虚空中进化出来,令人兴奋,几乎是纯粹的。”
在国际象棋中,AlphaZero最初并不知道它可以拿走对手的棋子。在几个小时的高速游戏中,不断地对抗更强大的化身,它变得更熟练,对一些人来说,比之前的象棋引擎更自然。在这个过程中,它重新发现了人类几个世纪以来的象棋理念,并增加了自己的天赋。英国特级大师马修·萨德勒(Matthew Sadler)将钻研AlphaZero的游戏描述为“发现过去一些伟大棋手的秘密笔记本”。
AlphaZero测试的九种备选国际象棋方案中,包括克拉姆尼克和其他人已经在考虑的无castling国际象棋,并在1月份举行了第一场专门的比赛。它消除了一种叫castling的移动方法,该方法允许玩家将自己的国王隐藏在其他棋子的保护屏后——这种强大的防御方式也会令人窒息。五种变体改变了棋子的移动,包括鱼雷象棋,在整个游戏中,棋子可以一次移动两个方格,而不是只在第一次移动的时候。
读取AlphaZero结果的一种方法是使用冷数字。与传统规则相比,无等级象棋下的平局更少见。学习了不同的规则后,AlphaZero放在不同棋子上的值就会发生变化:在传统规则下,皇后的值是9.5个卒子;在鱼雷规则下,女王只值7.1卒。
最终,DeepMind的研究人员对该项目中另一个伟大的象棋大脑克拉姆尼克(Kramnik)的分析更感兴趣。“这不是关于数字,而是优质愉悦的感受人类坐下来玩游戏,”Tomaev说。周三发布的一份技术文件中,有70多页克拉姆尼克对AlphaZero探索的评论。
克拉姆尼克在AlphaZero如何适应新规则的过程中看到了一些亮点。他说,无等级象棋激发了保护国王安全的丰富新模式。另一个更极端的变化,自我捕获国际象棋,玩家可以自己拿棋子,被证明更有吸引力。克拉姆尼克说,这一规则实际上给了玩家更多的机会,让他们可以牺牲一部分来获得成功。几个世纪以来,这种战术一直被视为优雅玩法的标志。“总而言之,这只会让比赛变得更美好,”他说。
克拉姆尼克希望AlphaZero在国际象棋中的冒险经历能够说服所有级别的玩家都尝试一下。“这是我们给国际象棋世界的礼物,”他说。现在可能是一个合适的时机。
两届美国女子国际象棋冠军詹妮弗·沙哈德说,国际象棋已经流行了多年,但随着许多人寻求新的智力刺激,国际象棋经历了大规模流行。人们对960国际象棋的兴趣也在增加,这表明人们对包括一些超级明星在内的新型玩法有了兴趣。本周晚些时候,沙哈德将为包括世界排名第一的卡尔森(Magnus Carlsen)和前冠军卡斯帕罗夫(Kasparov)在内的960国际象棋(Chess960)锦标赛提供评论。
和克拉姆尼克一样,沙哈德在AlphaZero测试的几个变体中也看到了一些类似的东西,尽管像允许卒子横向移动这样的变化让人感觉“难以置信”。“如果有市场获得吸引力,一些玩家仍将希望依靠电脑和深入研究来领先,但重新设定周期可能会引人入胜。”Shahade同时也是美国国际象棋联合会的女子项目主任,她说:“这些发现会让人感觉新鲜——这将是非常令人兴奋的,而且会让不同类型的玩家受益。”既然机器是不可战胜的,DeepMind和克拉姆尼克的项目可能也会鼓励计算机国际象棋变得更有创造性。
以色列巴伊兰大学(Bar-Ilan University)研究员伊莱大卫(Eli David)表示:“我们可以专注于把国际象棋作为一种游戏形式的艺术,而不是让计算机国际象棋变得更强大,从而摧毁人类。”大卫自己制造了一台以机器学习为动力的国际象棋引擎。在他的实验室里,一名研究生正在研究一种能模仿特定棋手风格的国际象棋软件,这种软件可以询问机器过去或现在最喜欢的大师在特定情况下会做什么。
Kramnik的经验表明,让人类与机器一起工作,而不是对抗机器,可以扩展游戏的情感体验和技术体验。AlphaZero甚至把他带到了他广阔的理解力之外的地方。他说:“三招之后你就不知道该怎么做了。”“感觉很好,就像你是个孩子。”