新浪体育 综合体育

围棋AI哪家强:AlphaGo已成传说 绝艺迎头赶上

信息时报

关注

上周,中国的围棋人工智能“绝艺”和中国围棋等级分第一人柯洁进行了两盘让子棋,绝艺在让两子的情况下取得了一胜一负的战绩。虽然柯洁事后吐槽自己赢的那盘没有任何报道,但无论如何,绝艺此前的那场胜利对于中国围棋人工智能是一座里程碑。虽然AlphaGo(阿法狗)早已退出棋坛,其研发团队Deepmind也早就表示过不会让AlphaGo与人工智能交手,很多人期待的“绝艺大战AlphaGo”并不会出现,但我们还是可以从侧面来对他们进行比较,看看中国的围棋人工智能与当今世界顶尖水平的距离还有多远。

□专题策划 魏必凡

专题撰文

信息时报记者 邓菲菲

比出身

AlphaGo成人工智能“鼻祖”

绝艺站在巨人肩膀上成长

AlphaGo在围棋人工智能领域是一座划时代的里程碑。在它横空出世之前,围棋电脑程序还只是处于业余4段左右的水准,但AlphaGo第一次公诸于世就是带着战胜职业二段樊麾的辉煌战绩而来,对棋界的意义不啻于阿波罗登月的那一步。而且它的每一步都在改写着围棋的历史:从“出世”时的战胜樊麾,到“人机大战”第一季4:1大胜世界冠军李世石,再到化名Master横扫网络,之后是“人机大战”第二季横扫柯洁,完美地完成了对人类的超越。

如果说AlphaGo是这个围棋人工智能时代的开拓者,绝艺就是站在巨人肩膀上的人。绝艺的研发团队成立于2016年1月,绝艺诞生于2016年3月。绝艺团队的负责人刘永升在接受采访时就曾坦言,绝艺用到了蒙特卡洛搜索树的技术,而这正是AlphaGo的核心技术技术之一,也是其取得突破的关键。所以说,包括绝艺在内,AlphaGo之后的围棋人工智能都是“同宗同源”。

也正因为如此,绝艺的起点要比AlphaGo高得多:前者需要自己去摸索每一步该怎么走,而绝艺可以借鉴AlphaGo的发展历程,再研究出自己的最优路线;AlphaGo诞生的最初阶段,“陪练”的职业棋手只是樊麾二段,而绝艺从一开始除了有罗洗河九段这样的高手作为陪练,还可以大胆放心地在网络上找各路高手对战。所以,从诞生到击败人类高手这一段路,绝艺“跑”得要比AlphaGo快得多。

比作用

AlphaGo重心转移造福人类

绝艺棋手“练级”最佳辅助

AlphaGo尽管在与包括柯洁在内的众多人类高手对战中取得了压倒性的胜利,但它并没有在正式场合跟人类棋手下过让子棋,而它在人机大战第二季完胜柯洁后已经退隐江湖、不再与人类下棋,所以,我们很难推测它的能力已经到了什么程度。而绝艺此次不仅与柯洁下了两盘让子棋,还在网上让两子先后与9位人类高手进行较量。

柯洁在被让两子的情况下和绝艺下了两盘,一胜一负。用柯洁自己的话说:“其实稳着下优势还是蛮大的……主要是第一次被AI让一手,真的有一种说不出的滋味……”按照柯洁赛后的总结,他与绝艺的差距并没有那么大。而绝艺与九位年轻高手对战的结果是7胜2负:它战胜了王世一四段、尹航五段、王昊星初段、陈翰祺二段、陈梓健六段、范胤七段和连笑九段,输给了范蕴若六段和谢科五段。

从绝艺落败的两盘棋来猜测,在大局控制力上,即便被让两子,人类棋手也很难与绝艺抗衡。在AlphaGo退隐江湖的情况下,绝艺成为了中国棋手的绝佳辅助工具。去年年底新奥杯决赛期间,赛后复盘时柯洁都会习惯性地问:“绝艺认为这手棋应该下在哪里?”显然,棋手对绝艺也是十分认可。而AlphaGo已经将重心转移到了医疗等实际应用领域,不再参加围棋比赛,这也是其研发的初衷:不是为了对付人类棋手,而是为了推动社会改革、改变人类命运。

比能力

AlphaZero让顶尖高手三子

绝艺顶多让两子实力略逊

距离人机大战第二季已经过去了8个月,由于没有再与人类棋手公开对战,我们无从得知AlphaGo已经进化到了什么阶段,唯一可以肯定的是会比跟柯洁对战那版的AlphaZero更进一步。而就目前公开的情况来看,绝艺大致还处于去年初横扫网络的Master近似的阶段,尚未进化到AlphaZero的水平。

不过,正如绝艺的研发团队在去年TWT特别挑战赛后所透露,绝艺目前还有待“进化”。腾讯AI实验室负责人姚星在接受采访时透露,绝艺不同于其他实验室AI,它得益于世界超一流棋手的指导,通过不断与高手交流及学习成长起来,因此可以推测绝艺的自我对弈还处于初始阶段。

去年10月,Deepmind公布了AlphaZero的研究成果,该算法可以采用自我对弈训练,仅通过72小时内490万对局的训练就用100:0击败了初代AlphaGo、比起Master也上了一个台阶。可以说,实现自我对弈训练是AlphaGo“封神”的重要一步,而绝艺目前显然还没有完全迈过这一步。如果单纯依赖与人类高手对弈,能突破人类上限的程度也很有限。正如柯洁所说的,现在的绝艺还不到让三子的水平,让两子也并非必胜,但AlphaZero,业界估测的大概就是可以让人类高手三子的水平。

加载中...