柯洁是人脑最后防线? 输给MASTER这次对弈意义在哪
新浪综合
柯洁
AlphaGo 战胜人类最好围棋选手,似曾相识的感觉
“以前柯洁和人类棋手下,始终显得很从容,但今天脸上充血,显得很紧张。”韩国围棋九段金庭贤说。
Google 黑板报整理了一段 22 秒的短视频,柯洁揪了自己 4 次头发,剩下时间单手抵住下巴或者扶额。解说嘉宾常昊表示柯洁揪头发是紧张的表现。
其它一些比如皱眉、咬手指、侧身坐、身子前倾等小动作和神情,频繁被摄像机镜头捕捉到。
“他(柯洁)以往在国内比赛,相对来说,他用的时间是比对手少。今天跟 AlphaGo 之间,他几乎多用了一个小时。”常昊说。
似乎所有人,都在期待柯洁有多紧张。
柯洁所处的对局室里只有寥寥数人,除了几家摄影媒体,还有 3 名工作人员、代替 AlphaGo 落子的黄士杰博士以及柯洁自己。整场比赛,黄士杰博士几乎面无表情地坐着,几乎匀速地执行 AlphaGo 计算出的最佳落子。
比赛进行到 4 小时 25 分钟时,柯洁输掉了比赛。
一年多前,AlphaGo 首战战胜李世乭,柯洁说“就算 AlphaGo 战胜了李世乭,但它赢不了我。”
输了比赛后,柯洁自陈 AlphaGo 越来越像围棋上帝,“我还是想和人类下棋,因为到未来,我们与 AlphaGo 的差距可能越来越大。”
这个画面似曾相识。
2016 年 1 月,AlphaGo 战胜欧洲冠军樊麾。
“AlphaGo 目前还没到与我谈论胜负的程度,对决结果将会是 5:0 或者 4:1。”李世乭在自己 AlphaGo 比赛的赛前记者招待会上报出出师表。他并不认为樊麾输给 AlphaGo 对自己起到什么威胁,在他看来,樊麾是业余棋手里的顶尖高手。
两个月后李世乭 1:4 输掉比赛。这位时年 33 岁的韩国围棋世界冠军如此评价 AlphaGo, “它(AlphaGo)可以始终保持心理平静和精神专注,就这方面而言,我觉得人类比不过它,尽管我还不大愿意承认,AlphaGo 在棋艺上胜过人类。”
同样的情况你也可以在国际象棋棋王卡斯帕罗夫 1997 年对战 IBM 深蓝时看到。
他没有考虑过自己会输给深蓝,之前还说过“国际象棋这游戏就是为我而设的。”
卡斯帕罗夫在 1999 年达到 2851 国际棋联国际等级分、2005 年退役。之后 8 年一直没人能超过他,直到 2013 年才由挪威人卡尔森打破记录。
但现在更多让人们记住、知道卡斯帕罗夫的事情,还是他在 1997 年输给国际象棋人工智能“更深的蓝”。
双手捧头的卡斯帕罗夫。图/Wiki
1997 年 5 月 11 日,国际象棋人工智能只用 19 步就战胜了卡斯帕罗夫。棋王这张双手捧头的照片成了他最广为流传的照片之一。
这次柯洁输的很少,但 AlphaGo 用的处理器功耗也只有去年的 1/10。下围棋,人被计算机超过,已经没有任何悬念。
关于 AlpaGo 和柯洁比赛本身的 7 个问题
1。 赛前,外界已经不对人类报什么希望
博彩网站预测给出 AlphaGo 获胜赔率 1.05、柯洁获胜赔率 8。也就是说买 100 元柯洁获胜,将能获得 800 元;买 100 元 AlphaGo 胜,能拿回 105元,只赚 5 块钱。
这和去年李世乭比赛前大不相同,当时还有很多人觉得人类能赢,包括人工智能专家。
“一年前我期待李世乭 3:2 或者 4:1 战胜 AlphaGo,我当时没预料它那么强大。今年的结果毫无疑问,AlphaGO 三场全胜。”曾带队制作跳棋和国际象棋程序的乔纳森·谢弗尔教授告诉《好奇心日报》。
2。 从围棋来看,柯洁是人脑的最后防线
如果说围棋是“人类智慧皇冠上的明珠”,那么这一次和 AlphaGo 对局的中国棋手柯洁九段无疑是最有资格守卫这份珍宝的人之一。
柯洁 1997 年出生,自幼学棋。2008 年取得初段段位,2014 年获得第二届百灵杯世界围棋公开赛冠军,成为中国大陆第 16 位围棋世界冠军,年仅 17 岁升九段。截至目前,柯洁共在以个人资格出赛的国际围棋比赛中取得 4 次冠军。
2016 年 3 月败于 AlphaGo 的韩国棋手李世乭九段比柯洁年长许多。李世乭 1983 年出生,至今在以个人资格出赛的国际围棋比赛中获得 18 次冠军。
国际上有一个非常简单粗暴的办法评价围棋选手的实力:定级分。法国计算机专家,也是围棋人工智能程序 CrazyStone 的作者 Rémi Coulom 利用选手的历史成绩结合 Elo 算法,建立了一个给这些选手打分的网站 Go Ratings。因为世界上并没有一个统一的围棋国际组织,这个网站的分数在很多时候被引用作为围棋选手世界排名。
从 1991 年到 2006 年,韩国名将棋手李昌镐连续 16 年在 Go Ratings 排名第一,李世乭则从 2007 年到 2011 年连续五年排名第一,柯洁从 2015 年开始成为世界榜首。
但柯洁本人认为,Go Ratings 的评分并不科学,认为它没有公信力。
目前,在 Go Ratings 的排名上,柯洁、韩国棋手朴廷桓、中国棋手芈昱廷、韩国棋手申真谞、中国棋手连笑分列前五名。李世乭排名第 6。
在去年李世乭败给 AlphaGo 后,柯洁曾发微博称,自己能战胜 AlphaGo。他也曾多次在国际大赛赛前,公开表示自己对比赛的信心。历史上,国际个人大赛中,柯洁和李世乭共有 8 次对弈,大比分为 8 比 2,柯洁占有明显优势。
3。 之前柯洁已经输给了 Master,这次对弈的意义是什么?
2016 年 12 月 29 日至 2017 年 1 月 4 日,一个神秘的账号 Master 出现在中国大陆的围棋在线平台奕城围棋网和野狐围棋上。奕城围棋和野狐围棋是最热门的围棋对弈平台,包括柯洁、井山裕太、朴廷桓、芈昱廷、连笑、古力等等众多日韩三国众多的围棋冠军和高手都注册有账号。
但 Master 在快棋比赛中展现出了针对人类的绝对优势。Master 和全世界 60 位世界冠军、国内冠军,包括中国著名围棋大师聂卫平在内对局 60 场,规则定为每 30 秒下一步的快棋。这 60 场比赛无一例外全部获胜。
Master 背后就是 AlphaGo。
在和李世乭和柯洁的比赛中,AlphaGo 的算法表现出了非常稳定的性能,能够以很稳定的节奏,平均几分钟一步下完整盘,而作为人类的柯洁和李世乭都多次陷入“长考”,花费很长时间思考落子的位置。和限时数小时的正式比赛相比,快棋对于 AlphaGo 这样的机器来说优势显著。
当年深蓝战胜卡斯帕罗夫也是这样。1994年卡斯帕罗夫就在快棋比赛里输给过一次人工智能,但两年后他在不限时的正式比赛里赢了深蓝。
真正被认为人类战败,是 1997 年,升级版深蓝战胜卡斯帕罗夫。
换句话说,在正式比赛里打败柯洁,AlphaGo 才能说战胜最厉害的人类围棋棋手。
4。 柯洁自己觉得有希望么?
看上去是没有。
赛前深夜,柯洁在微博上发了一篇题为《最后的对决》的短文。他在文中写道:“无论输赢,这都将是我与人工智能最后的三盘对局。因为现在的 AI 进步之快远超我们的想象。”
柯洁在去年李世乭与 AlphaGo 对阵中曾经发过这样一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”那条微博被转发了三万次。
但是在今年赛前,柯洁写道:“我相信未来是属于人工智能的。”
去年年末与 Master 对战之后,柯洁深夜写道:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。”
但他也继续说棋手会结合计算机,迈进全新的领域,达到全新的境界,就像“新的风暴继续来袭”。
5。 机器,AlphaGo 和一年前有什么变化?
从比赛形式上看,柯洁和 AlphaGo 的三番棋对决和去年李世乭的比赛没什么差别——AlphaGo 调用云端的运算资源,一位工作人员和人类旗手对坐,负责摆出棋子。
不同的是这次比赛增加了团体赛,柯洁还会在 5 月 25 日和 5 月 27 日与 AlphaGo 再下两盘。在 5 月 26 日,数名中国顶尖职业围棋选手还会组成团队和 AlphaGo 进行两盘团体和配对比赛。
实际上这一次 Alpha Go AlphaGo 背后的计算能力只有此前对战李世乭那会儿的 1/10。去年战胜李世乭时,AlphaGo 的程序需要依靠全世界 Google 很多机房提供计算能力。
而今天的 AlphaGo 的算力需求更小,它不再是分布式运算,整个程序仅运行在一个单一的云服务器 TPU 上。这是 Google 去年在开发者大会上发布的用于人工智能计算的单处理器计算机,全称是 Tensor processing unit。
从计算机消耗的能耗来看,去年李世乭相当于面对 10 台计算机打比赛。而今年柯洁的比赛是货真价实的一比一对抗,AlphaGo 的程序性能提升了至少 10 倍。
6。 除了柯洁,这次还有两个人类群殴 AlphaGo 的比赛, 有什么意义?
这次的团队赛还分为两种:一种是人类组队对阵机器,第二种是,人和人工智能算法合作,对阵人类。
意义很明确:如果人工智能算法能够打败单个人类,那么用人类的集体智慧和写作文对应人工智能是否能赢?人+机器这样的组合,能不能产生更好的结果?
这样的比赛之前也有过。2005 年,Playchess.com 举行了一场“自由式”象棋大赛,参赛者可以任意和其他人或者电脑组队。通常情况下,象棋网站都会运用“反作弊”算法来防止参赛者用电脑程序作弊。
重赏之下,好几位特级大师都携多台电脑参加了比赛。一开始,结果不出预料。人和电脑组队,要远远胜过最强的电脑。“九头蛇”(Hydra)和“深蓝”一样,是一台专业象棋超级电脑,而面对棋力较强的人类选手和一台较弱的笔记本电脑的组合,它却败下阵来。人类的战略引导加上电脑精确的战术计算。
但更有意思的是,最后的赢家并不是“人+高配置电脑”的组合,而是两位美国业余选手和三台电脑的组合。
他们的技巧是通过干预和“教导”,让电脑们更深入地搜索可能的局面。这一策略不仅胜过了特级大师们对象棋的精深理解,也胜过了其它参赛者的超强计算能力。
“棋力较弱的人类+机器+优化的步骤”比强力的电脑本身技高一筹,也优于“棋力较强的人类+机器+较差的步骤”。
7。 李世乭在赛后怎么看待自己的失败?
李世乭在去年 6 月的夏季达沃斯论坛上说,赛前自己存在判断失误,低估了对手的水平:
“当时我看了它和樊麾的比赛,之后我觉得 AlphaGo 应该不是我的对手,比较确信我会赢。但是没想到,深度学习在六个月期间有这么大的进步。”
他说人类和机器对弈的时候,人是处在不利地位的。AlphaGo 始终如一,没有情绪波动,甚至也不会意识到下到第几局、整个场面是什么情况。
“我再也不想和 AlphaGo 比赛了。”李世乭说。(好奇心日报)