AI专家:攻克围棋原理已找到 GPT学围棋令人期待
国家围棋队官方合作伙伴少年纵横特约报道。
2017年柯洁泪洒乌镇后,人类围棋与人工智能围棋之间的对抗彻底没有了悬念。虽然AlphaGo退役了,但根据他们的相关论文,后来又衍生出了绝艺、天壤、星阵、KataGo等诸多围棋人工智能,有的已经成为了大家日常研究围棋的工具。在研发这些人工智能的专家眼里,“人工智能攻克围棋了吗”这个问题是什么样的呢?
天壤与朴廷桓的“人机大战”
李凯华,原天壤围棋负责人,2018年人机对弈击败朴廷桓。
新浪棋牌:您觉得人工智能攻克围棋了吗?
李凯华:没有。围棋的变化数量决定了其最优解集合都可能是一个无法估计的大小。人工智能当然没有攻克围棋。人工智能目前所做到的是其探索的围棋变化数量比人类已经探索的围棋变化数量大出很多个数量级,大约是:AI目前所有的训练棋谱 / (人类已经下过的所有棋谱+人类已经研究过的变化图) 大约 = 1万倍到10万倍。
这个数量距离围棋合法变化总数也就是10的170次方个盘面,仍然有相当大的差距。
当然对于科学研究来说,AI已经做到了在现有技术条件下最大限度的探索。原因有两点:
1。 通过数学层面的推导,可以得出通过深度神经网络和强化学习可以不断让棋力变强,所以只要:人类有足够的时间和足够的存储设备可以生成并存储10的170次方个盘面,一定可以找到围棋的最优解。科学研究上走通了这条路就可以了。毕竟即使每一颗原子上都能存一个合法变化的,宇宙里也只有10的70次方个原子,离围棋的合法盘面总数还有10的100次方倍。
2。 围棋是完全信息下的零和博弈,相比之下,德扑、麻将这种非完全信息博弈,以及协作情况下的非零和博弈,甚至跳出博弈论层面,在生成层面,有更复杂的情况需要去研究,所以在14年Ian Goodfellow搞出来了生成式对抗网络,17年Google大脑搞出来了《Attention is All You Need》,也就是ChatGPT的基础Transformer模型。然后AI研究的领域前沿就一直是在Transformer模型了。
3。 现在来看结论是客观上AI并没有真的攻克围棋,但是原理上已经找通了攻克围棋的方法,所以科学上可以认为“人工智能已经攻克了围棋”。
新浪棋牌:您认为当前人工智能围棋最高水平达到了什么程度?
李凯华:1。因为围棋的合法盘面数是10的170次方,人类大概探索过不超过100万种变化,人工智能探索过差不多100亿种变化。即使如此,还有10的160次方种变化,所以如果围棋上帝是100的话,目前AI探索了不到兆分之一。人类是AI的万分之一。离之前说的7%,都相去甚远。
2。 当前人工智能的最高水平如果按最新的KataGo的强化学习来说,最新的模型达到了13500左右的Elo分。
3。 注意Elo分只能用来比较同一个体系下的相互强弱,也就是AI的Elo分和人的等级分是两个体系,不能直接比较数值。除非找到一个锚点,比如用李世石的Elo分来估计AlphaGo Lee版本的棋力。
4。 但是只有两个人有充分的对局之后,Elo分所体现的强弱才有效,所以比如古力和李世石两个人下了几十盘棋,他们之间的Elo分差距可以表示他们的棋力强弱,但是想要Elo分的误差在5分以内,两个选手需要对局至少89局。想要误差在3分以内,两个选手需要对局至少200局。所以所谓用李世石的Elo分带入AlphaGo的Elo分再比较AlphaGo和当时的棋手之间的棋力差距,纯属娱乐。对局太少。
5。 Elo分还有膨胀的现象,即如果模型都是同一个风格,或者同一个体系的话,同时没有外部模型的干扰,如果一个阶段的模型出现过拟合的现象,那么很快分数就会因为这些模型被膨胀起来。后续也无法进行修正。
6。 目前如果粗略估计一下棋力的话,最强的KataGo如果搭配很好的分布式服务器,比如说给个100张A800显卡,或者最新的那个GB800显卡,让人类最强棋手3-4子是可能的。不过那一局棋的电费恐怕得小10万了。
2018年与天壤对弈的朴廷桓九段
新浪棋牌:后续研究的终点在哪里,还有无难关?
李凯华: 1。 从AlphaGo到Leela到KataGo的路线相当于让一个婴儿只看棋谱学下棋。脑子只会下棋。所以需要大量的棋谱来教他。同时因为他其实是看图学下棋,没有逻辑推理能力,所以想要变强只能不停地自己下,看更多的变化来学习下棋。显得很笨重。
2。 后续可能会希望让ChatGPT,一个10几岁智商但是什么都会的孩子,但是有一定的语言方面的推理能力,看能不能不通过看图的方式,而是研究棋谱的方式来学下棋,有没有可能用更少的棋谱来实现跟AlphaGo一样的强度。甚至等更强的ChatGPT 5.0版本,如果能相当于一个成年人的推理能力,应该会更顺利。
人机对弈现场
新浪棋牌:人工智能围棋陪练技术有何发展?
李凯华: 1。 如果能走通让语言模型来下棋的话,那么让语言模型来解释它为什么这么下棋就是一件很轻松的事情了。
2。 目前的话职业棋手主要还是靠背和猜来理解人工智能下的棋。
3。 面向孩子的AI陪练的等级和难度非常能把握,因为孩子棋力的提升是不连续的,往往是一个阶段性跃升的情况。而且不同的棋力所对应的计算力、博弈能力也不是线性提升的,导致目前所有的调参都很蠢,基本上是无参可调的情况。这一方面可能是一个长期存在的问题。不妨等着4(a)解决了之后交给AI来解决吧。
(周游)