黄士杰临别感言:AlpahGo研究之旅画上美好句点

新浪综合

2017.12.1323:18

关注

黄士杰

据新智元公众号报道。

[新智元导读]刚刚，DeepMind黄士杰博士发表消息，表示AlphaGo项目正式结束。如果一定要有一个人为AlphaGo的研究划上句点，黄士杰当之无愧。从AlphaGo第一次出现在公众视野时，黄世杰便是AlphaGo的最佳代言人。他抬手、落子，行机器之智能，走出一代大师风范。他冷静、他沉着，他是AlphaGo的“人肉臂”。而他的离开和谢幕，代表了一个时代的终结，也是更加激动人心的开始。

12月寒冬的最冷一天，这条深夜的临别感言引爆了朋友圈，热闹喧嚣的讨论更映衬出一个时代终结的孤寂悲凉，黄士杰，一位精通围棋的AI工程师，他一手造就的AlphaGo，已经登峰造极，而他离去的身影，也或许窥见了人类的未来。大时代的一批传奇人物谢幕，他是寂寞的，自己培养的AI取代了他，如果一定要有一个人为AlphaGo的研究划上句点，黄士杰当之无愧。从AlphaGo第一次出现在公众视野时，黄士杰便是AlphaGo的最佳代言人。他抬手、落子，行机器之智能，走出一代大师风范。他冷静、他沉着，他是AlphaGo的“人肉臂”。时代的前进脚步从不停歇，人工智能的盛世爆发正在来临，“人肉臂”黄士杰转岗，对AlphaGo深情的告别，都是在 AI围棋的里程碑上落下绚烂的一笔。

针对未来发展方面，黄士杰表示，DeepMind 有兴趣的领域除了围棋之外，还有‘医疗’跟‘机器人’，希望能够让世界变得更美好，至于他自己个人的下一步，当然就是选一个有兴趣的领域去投入。现场有媒体再次询问下一个目标是不是挑战《星海争霸》、《英雄联盟》这个模拟策略游戏领域，黄士杰并没有把话说死，表示：“内部还在讨论”。

11月27日，黄士杰在Facebook转发了一则关于DeepMind将与一些顶尖的研究机构共同投入诊断乳腺癌的AI研究消息。DeepMind将利用最新的机器学习技术，希望能够快速、准确地检测出癌症的迹象，帮助医生尽早发现癌症，以便更早的有效治疗，此举或许能捕风捉影体会到黄士杰之后的动态走向。

黄士杰，他就是AlphaGo本身

黄士杰出生于台湾，1997考入台湾国立交通大学就读大学本科，专业为计算机与信息科学。2001年到2003年，在国立台湾师范大学就读计算机科学和信息工程硕士。2004年到2011年在国立台湾师范大学完成了博士学业，博士论文就是“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”。

黄士杰专精于人工智慧领域，硕博士论文都在台师大资工所教授林顺喜指导下完成，据其导师林顺喜回忆，黄士杰是个很努力的学生，对围棋也非常有兴趣，是台师大围棋社创社社长，就读时就有围棋业余6段的资格。

林顺喜透露，黄士杰的博士本来5年就可念完，但为了延续研发成果，多念了2年，博士班7年级时，他所开发的围棋程式“Erica”击败了当时国际公认的最强程式“Zen”，并在日本举办的国际电脑奥林匹亚中拿下19路电脑围棋金牌。

黄士杰博士毕业后在加拿大艾伯塔大学做了一年研究员，随后于2012年加入DeepMind，担任高级研究员。2014年1月26日，谷歌以5亿美元收购了这家日后将会大放异彩的公司。自此，黄士杰在谷歌DeepMind任研究科学家。同年2月，AlphaGo项目正式启动，团队只有3个人：哈萨比斯、席尔瓦、黄士杰。

项目启动伊始，团队就决定将沿着深度学习和强化学习的方向探索。无疑，这条道路将无比艰难。然而，他们还是上路了。

2014年6月，AlphaGo通过卷积神经网络学习了很多人类棋谱，能在3毫秒内做出堪比人类的下棋直觉。黄士杰将它命名为“策略网络”，并在GPU上进行持续的训练优化。

一年之后，AlphaGo阅读棋局的能力提升了很多，可以检索多种局面变化，并且找到最佳的应对方式，可以算出后续40-60步棋。

自此，有越来越多的深度学习专家加入了这个一开始只有三人的团队。8月，AlphaGo将掌握称霸围棋世界最关键的能力：形势判断。AlphaGo通过自我对弈，训练出价值网络，进而可以判断每一手棋背后代表的胜率。这就形成了形势判断的能力。据黄士杰回忆，他当时已经感觉到AlphaGo的强大。10月，樊麾大战AlphaGo，当时代替AlphaGo落子的正是黄士杰。樊麾输了。但这一消息当时并未被公布。

2016年1月27日，Nature杂志介绍了DeepMind团队的AlphaGo，以及樊麾输了的消息。黄士杰与席尔瓦是这篇论文的第一作者。

又过了2个月，AlphaGo击败了李世乭。这次，依旧是黄士杰代替AlphaGo落子。这也是黄士杰第一次出现在观众的眼前。

这年年底，一个叫Master的棋手大开杀戒，连续斩杀各路围棋高手。取得59场连胜之后，Master公布了自己的真实身份：“我是AlphaGo的黄博士”。黄士杰，又是黄士杰。

2017年5月23日，柯洁对面坐的，仍然是黄士杰。在对战结束后，柯洁说，“黄博士来摆棋，可能更让我有和AI对战的感觉。我也特别佩服黄博士，大家看直播也能看到我很爱动，总喜欢活动身体，而黄博士总是一动不动，不上厕所、不喝水、也不吃东西……所以跟黄博士下棋时，我觉得黄博士就是AlphaGo。”

AlphaGo一路厮杀，黄士杰始终在侧，甚至可以说，他就是AlphaGo本身。

AlphaGo 小传

姓名：AlphaGo（Fan，Lee，Master，Zero）

别名：阿老师，阿尔法狗

生日：2014年

出生地：英国伦敦

1、击败樊麾

2015年10月，AlphaGo击败樊麾，成为第一个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序，写下了历史，相关成果在2016年1月发表于Nature

2、击败李世石

2016年3月，AlphaGo在一场五番棋比赛中4：1击败尖端职业棋手李世石，成为第一个不借助让子而击败围棋职业九段棋手的电脑围棋程序，再创历史。五局赛后韩国棋院授予AlphaGo有史以来第一位名誉职业九段

3、排名短暂超越柯洁

2016年7月18日，AlphaGo在Go Ratings网站的排名升至世界第一。但几天之后被柯洁反超。

4、Alpha Go化名“Master” 60连胜

2016年的倒数第三天，一个用户名为“Master”的围棋用户，连续在围棋平台大开杀戒，“斩杀”包括柯洁、朴廷桓、井山裕太、陈耀烨、申真谞、常昊、古力等各路围棋高手，最终以以60连胜告终。柯洁连输三场，期间还因为急性肠胃炎住院……

在第59场时候，“Master”自报家门：“我是AlphaGo的黄博士”。

5、AlphaGo大败柯洁，柯洁落泪哽咽

2017年5月27日，乌镇围棋峰会，柯洁总比分 0：3 败于AlphaGo。比赛中，柯洁在局面不利时长时间离开，回来后又泪洒现场。赛后柯洁一度哽咽称：它太完美我很痛苦，看不到任何胜利的希望。

6、AlphaGo Zero横空出世自学21天虐Master

2017年10月，DeepMind最新版AlphaGo论文介绍了迄今最强最新的版本AlphaGo Zero：使用纯强化学习，将价值网络和策略网络整合为一个架构，3天训练后就以100比0击败了上一版本的AlphaGo。

7、AlphaGo教学工具正式上线，柯洁：重新学习围棋

2017年12月11日，AlphaGo的启蒙老师、欧洲围棋冠军樊麾在微博上透露：“AlphaGo教学工具共有两万多个变化，三十七万多步棋组成，通过AlphaGo的视角，分析并建议围棋开局的诸多下法。随后，当今世界围棋第一人柯洁随后转发此条微博，并评论到：“重新学习围棋。”

AlphaGo已经退休，但技术永存。

谨以此文，致敬AlphaGo，以及研发AlphaGo的人。

“阿尔法围棋”要开班收徒职业棋手如临大敌

机器教的和人教的，谁更强大

浙江在线12月13日讯（浙江在线记者张峰）乌镇一役后，阿尔法围棋宣布“退役”，就当大家以为它一骑绝尘不再回头时，它又突然跳出来“教”围棋了。

12月11日晚，DeepMind团队围棋大使樊麾在社交媒体宣布“AlphaGo教学工具”上线，再次引发了大家的讨论，人工智能开始应用于围棋教学了吗？有了人工智能教学，传统的围棋学习方法还有意义吗？它教出来的学生会更强大吗？

据樊麾介绍，教学工具共有两万多个变化，三十七万多步棋组成，通过AlphaGo的视角，分析并建议围棋开局的诸多下法。同时每步棋AlphaGo都会给出自己的胜率分析。而且附以简体、繁体中文和英、日、韩语的版本。据了解，这次的AlphaGo教学工具使用的是今年和柯洁的人机大战中三战全胜的版本。

随后众多职业棋手纷纷发表了自己的看法，柯洁表示：“重新学围棋。”常昊说：“教学工具不一定是标准答案，更多是给予了我们无限的思考空间”，而周睿羊则直接说：“定式什么的还是不要随便学了，看到工具一些高级下法之后感觉又可以起飞了。”

人工智能在围棋领域的发展一直颇受瞩目，如今已经发展到人类难以望其项背的地步，对职业棋手的比赛、围棋的培训教学都有了不小的影响。

就在今年10月31日，中国围棋协会发布了职业围棋比赛的补充规定，其中包括：比赛期间，对局棋手一律禁止携带、观看手机及其他电子设备，一经发现立即判负；午休时间由一小时缩减为半小时，对局棋手中途一律禁止回房间，如因特殊情况必须返回房间的，须有当值裁判陪同；团体比赛中，如发现棋手所在队领队、教练及其他相关人员利用人工智能技术影响对局进程，一经查实，全队当轮成绩取消。

在随后的围棋职业甲级联赛中，赛前收手机就成了规定动作。浙江省围棋协会秘书长卢俊和告诉记者：“新规定的出台确实是因为受到围棋AI的影响，之前其实就有过二线棋手在比赛中通过软件作弊的，不过以前的AI水平不够，因此影响没这么大，如今阿尔法狗、绝艺等AI的围棋水平已经超过了人类棋手，从保证职业比赛公平公正的角度考虑，就不得不有这样一个规定。”

如果说阿尔法围棋的出现是对顶尖棋手的一场胜利，那么教学工具的出现，是否在向传统的围棋教育方式发起挑战呢？经过多年的发展，围棋在国内形成了完整的教学培养体系，打定式，做死活成为无数学棋少年的必备功课，在阿尔法工具下这些定式还是标准答案吗？如果让阿尔法教学工具来教棋，培养出的棋手会比人类教出的棋手更强吗？

苏泊尔杭州队主教练汪涛告诉记者：“当天晚上这个一出来我们的队员就试着用这个工具，在我来看这个对于职业棋手的影响会比较大，因为它会给出一些我们之前没有想到过的下法，给已经定型的职业棋手打开一扇新的大门，对于我们日常训练有一定的帮助的。但是这个工具对于初学者来说作用不大，首先他没有文字注释，只有一个胜率的计算，不会告诉你为什么要这么下，如果你无法理解就没办法学会；另外这个系统的布局目前只能到30手，想要把它作为初学者的教学工具还是远远不够的，只能等后面有更丰富的内容再看。”

而在不少家长看来，人工智能的强大并不会阻碍孩子学棋，来自湖南的邓静两年前就将8岁的孩子送到中国棋院杭州分院学棋，她告诉记者：“孩子学棋是因为他自己感兴趣，而且学棋起到了帮助孩子成长的作用，学棋以来他的思维能力、学习能力都得到了提高，就算以后不能成为职业棋手，他也有一技在身。就算人工智能比人厉害，但是围棋比赛还是人和人比，它的出现并不能打击孩子学棋的积极性，反而激发了他们的斗志和学习欲望。”

【本文来自微信公众号“棋道经纬”】