新疆都市报 > 教育 > 考试 >

头条 胡耀宇:如何看待AI意见?AI不了解棋手心理变

发布时间:2020-03-10 22:08来源: 未知
AI不了解人类棋手的心理变化

  内容如下:来源:耀宇围棋前天我在一招一境界(2)中详细聊了李昌镐在1996年东洋证券杯决赛五番胜负第一局中的白88这步棋。大家在评论区对这步棋谈了各自的感想,同时有很多棋友特别关心一个问题:

AI不了解人类棋手的心理变化

  “AI如何看待李昌镐白88这步棋?”

  这个问题很有意思,正好我一直想跟大家聊聊关于如何看待AI的意见这个话题,所以今天就着大家这个提问,跟大家一起讨论一下。

  在讨论之前,我先抛两个问题出来:

  1:如果李昌镐白88这步棋不在AI的考虑范围内,那这步棋就一定是问题手吗?

  2:如果AI给李昌镐白88这步棋降了胜率,那就代表李昌镐在这盘棋中的胜算变小了吗?

  这两个问题其实可以合成一个大问题:

  AI给出的意见,就一定是好的吗?

  下面我们先来看看AI是如何看待李昌镐白88这步棋的:

  图1:我们先回顾一下李昌镐白88下在了哪里?

  白88下在了上面的一路立,关于这步棋的故事,我前天已经说了,这里就不多讲了。

  我在写李昌镐白88这步棋之前,就看过星阵的建议,白88这步棋不在星阵的选择范围内。

  而星阵的首选,也就是它推荐的一手棋是:

  图2:我估计李昌镐若在当时看到星阵白1这步推荐,应该会吓一大跳。

  这是孤身单挑黑三角六子的节奏。

  的确,别说是李昌镐这样谨慎的棋风,就是剑法最霸道的申真谞来了,估计也不会去动黑三角六子的脑筋。

  当然星阵有它的理由,它显然不认为你黑棋三角六子很强,它要来攻击黑三角六子。

  那么星阵推荐的这步棋就一定适合李昌镐来下吗?

  下面我就以虚构的形式,来跟大家推演一下,如果李昌镐采取了星阵的推荐,会发生什么情况:(以下内容纯属虚构)

  图3:李昌镐正准备下白88(白A),心里想着:“这步棋虽然实地价值小了,但是可使白三角大块彻底净活,而黑三角大块则没有安定。关键这样简化了局势,接下来慢慢小刀割肉。这种局面是我最擅长的。”

  正当李昌镐要落下白88时,星阵突然出现,悄悄跟李昌镐说:“我觉得白1这步棋胜率最高,我推荐白1这步棋。”

  李昌镐一看白1这步棋,心想:“白1这步棋不像是优势情况下的招,倒像是形势不利下的胜负手,可这时候明明是白棋形势好,这步棋靠谱吗?

  但星阵实力那么强,它推荐的招,总不会错吧。”

  于是李昌镐就改变原计划,采取了星阵的意见,下出了白1这步棋。

  而此时李昌镐的对手,正处于劣势下的马晓春,正愁全盘找不到敌人可以搞乱局面。突然发现李昌镐白1自己找来了,心中大喜:“此时不反击,更待何时!”

  于是黑2反包围白1一子是必然的选择。

  那么接下来白棋该如何处理呢?

  图4:白1靠,利用黑三角孤单一子做文章,是星阵的后续手段。

  李昌镐下出此手后,马晓春黑2长也是必然,不然在A的位扳的话,白棋在黑2位一虎,黑棋形有问题。

  当黑4压的时候,星阵选择了白5、7顶断后,白9长出。

  这下有意思了,原本是奔着收官格局去的局面,突然变成了乱战的格局:

  图5:当前局势,处于完全混战的局面。

  黑棋左边三角大块、上方圆圈大块、中央方块四子均没安定。

  而白上方三角大块、中央圆圈两子、包括左下白方块四子也有隐患。

  因此马晓春肯定要黑1飞,先把左边黑三角大块和上方黑圆圈大块连络再说,顺便也起到了分断白圆圈两子和上方白三角大块的作用。

  虽然黑自身还留有白A位靠的手段,并未完全连络,但是白棋左下也欠着黑B位扳的手段:

  图6:黑1飞的时候,假设白2跳一个,那么左下黑3、5扳了一虎后,白棋若防A位的断点,黑B位扳下后,原本与世无争的白三角一子也被分断加入了战团。

  整个局面就一个字:“乱”

  图7:所以当马晓春黑1飞的时候,李昌镐是已经彻底晕菜了:“本来可稳稳拿下的棋局,怎么现在头绪越来越多,完全看不清了。”

  而马晓春此时则越战越兴奋,士气大振。毕竟在劣势下,能争取到与对手有50%概率一赌生死的机会,那是多么幸福的事情。

  此刻的李昌镐,不知路在何方,只好继续求助星阵。

  星阵当然有招,对于它来说,这怎么会是五五开的战斗呢?这明明就是八二开的战斗。

  不过星阵也是悄悄来到李昌镐身边,不易停留太久,于是准备撤退。

  而且星阵觉得:“我都给你教到这里了,剩下的就好办了,你自己来就可以。”

  李昌镐这下傻了:“让我自己来?你把我领到最复杂的时候,你让我自己来?”

  李昌镐本来就不擅长这种几块棋乱战的局面,再加上他原本就是优势的一方,此时出现这样的乱局,他的心态也难免受到波动。

  而马晓春本来在劣势下正愁找不到头绪,现在出现五五开的战斗乱局,那简直是白来的,那他肯定是越战越勇,哪招最狠就来哪招。反正本来就是输面大的棋,杀输了也没啥,但要是杀赢了那就赚了。

  之后的情形可以想象,李昌镐在大概率上会遭到马晓春的逆转。

  虽然星阵还是没有想明白:“这变化不是很简单吗?我都算了几百万个变化,肯定没有问题的。为什么李昌镐被逆转了?”

  星阵同学,你可能忽略了一个问题:

  “李昌镐虽然是绝顶高手,但他毕竟还是个人,而你是AI,你俩的计算资源差了好几个量级好不好。”

  那么关于星阵为何觉得白棋可战,这其中涉及的变化就太多了,估计我自己都要先在棋盘上研究一天,都还未必能搞清楚。所以就不在这里跟大家聊了。

  好了,以上这个虚构的科幻故事讲完了。从中我们可以看到两个关键问题:

  1:我们和AI之间有个不对等的地方,那就是计算资源。它一秒钟可以计算许许多多的变化,我们可能只能计算一个变化。

  比如AI觉得白棋完全可战的时候,李昌镐可能已经一脸懵了。

  2:AI与我们之间也有个不对等的地方,那就是人性。是人就有情绪、有欲望、有心理波动,有自己的长处和弱点。而AI的计算里,并没有把这些变数给算进去。

  比如李昌镐发现原本可简明优势的棋,突然变成五五开的乱战局面时,他的情绪会出现负面的波动,而这又是他不擅长的格局;而劣势下马晓春此时一看有命可搏,则士气大振。这些看似无形的因素,是会对最后的胜负产生很大的影响。

  所以李昌镐白88下立,虽然在AI眼中,不是一步正解。

  但它在1996年,也就是24年前的那个时代背景下,这步棋就是通往胜利之路最快捷也是最简洁的一手。

  因为那个时代的李昌镐,有一个很大的特点就是不动如山。他能控制住自己的贪欲,尽量把棋局导向他能掌控的局面,哪怕最后仅仅只是小胜。

  因此从技术的角度来看,这步棋安定了白三角大块,使得黑三角大块更为不安定。从而消除了局面的变数。接下来的一切都在李昌镐的能力精算范围之内。

  而从心理的角度来看,此手下完后,李昌镐的心态愈加笃定,而他的对手马晓春则在劣势下一时找不到敌人,心理越发着急,结果很可能露出破绽被李昌镐扩大领先优势。

  而AI推荐的A位这步棋,也许相比李昌镐白88来说,离围棋上帝眼中的“正解”更近,但问题是,这招棋未必适合人类棋手;更不适合李昌镐这样的棋风。

  这招棋从技术的角度来看,它使得原本风平浪静的局面突起波澜,搞得好几块棋都加入了战团,那么这种局面对于人类棋手来说,已经超出了他们的精算范围之内,后面的胜负,将完全听天由命了。那么这对于执白优势一方来说,这个策略无疑是不合理的。

  那么从心理的角度来看,这招棋一下,使得原本处于优势情况下的白棋变成了五五开的乱战格局,那么李昌镐心里就会开始发虚,而马晓春则光脚不怕穿鞋的,求之不得。这样一来,率先露出破绽的很可能就变成李昌镐了。

  所以我们现在回头再来看,假设李昌镐白88下完后胜率是70%,而星阵推荐的这步A位下完后,胜率达到了90%。

  那么对于星阵来说,白88无遗是降了胜率;可对于李昌镐来说,若是下了A位,倒反而是降了胜率。

  那么到底谁对谁错呢?

  谁都对,只是他们本就有不同之处罢了。

  原因还是那两点:

  1:人类棋手没有AI强大的计算资源

  2:AI不了解人类棋手的心理变化

  最后我再聊聊这两点:

  第一个问题:由于人类棋手没有AI强大的计算资源,因此很多时候,AI觉得没问题的路,只是因为它掌握了越过这条路的路径和方式。但这未必适合于你,也许你选了这条路后,你就掉坑里去了。

  这就好比是小马过河的故事,大象觉得这条河很浅,可小松鼠若听了大象的话直接就上了,那它一下水,就会发现,这水太深了。

  所以到底这条河的深浅如何?小马还需要结合自身的情况和特点来独立判断。

  第二个问题:AI所计算出来的结果,并没有把人类的情绪和心理波动、以及其自身的性格特点而导致的非理性行为给计算进去。

  举个例子,AI通过超强的计算力,可以计算出股票市场的大致走向,但这是建立在“人们都是在理性的投资”这个前提下。可事实上,这个前提存在吗?一个涨停板,我们的心跳加速起来;一个跌停板,整个人又都不好了。市场上一个风吹草动,就会给市场造成极大的波动。这些人性的特点所带来的变量,并不在AI的计算范围内。

  所以AI的建议,只是在它的计算能力范围内,以及去除了人这个复杂变量的前提下,所得出的最佳答案;可对于我们人类而言,这个答案到底适不适合我们拿来用,这还需要有一个自己的判断和筛选。

  我有时会看到这样的话:

  “你看,以前大家认为某某某很牛的一步棋,现在拿AI来看,也不过如此嘛。”

  怎么个不过如此?这不是简单放个胜率就可以定案的。

  若要想定案,至少需要有以下几点说明才是:

  首先,你需要说明AI给出的意见,其背后的用意是什么?同时解释一下它这步棋比对局者当下这步棋好在哪里?比如AI白1这步棋是想冲击黑左下六子,它认为黑左下六子并不厚,如果能冲击到,那么李昌镐白88就成了缓手。

  然后,你还需给出自己的判断,就AI这步棋虽然好,但到底适不适合我们使用?比如白1冲击完所引发的战斗,是否在人类的计算范围内能看出白棋的确明显可战,要是大家一看,这不是五五开的战斗吗?那就要掂量一下,这是否适合我们使用,尤其还是在局面优势的情况下。

  接着,如果AI推荐的这步棋,的确适合人类棋手使用,那么是否适合当下对局者的棋风特点?比如李昌镐明明是不动如山的风格,你偏要他跑到左下去挑衅黑棋,关键这个战斗获胜的概率也就60%,那你很可能就是坑他了。

  再接着,你还需要考虑到两位对局者在当前局势下,所处的心理状态又是什么样的?明明一方处于穿鞋的状态,另一方处于光脚的状态,你说AI认为他应该下得更积极些。但问题是,AI没有风险这个概念,但人面对风险时,心态是会有波动的。

  最后,若是评价历史棋局,则要回到那个当下的时代背景去理解对局者的招法。

  比如常昊和崔哲瀚那次应氏杯决赛第三局,也许常昊那步白92脱先并非最佳之手,但这步棋对于常昊来说,就是在精神上突破自我的一手,就是因为他具备了下出这步棋的勇气,所以才能凤凰涅槃。

  所以,解释AI的意见,不是那么好说的,起码不是随便一句:“这步棋不是AI推荐的或者降胜率了,所以差评。” 就能搞定的。

  AI的胜率之下,有着人类无法企及的计算资源,所以我们要对AI的意见持有自己的主见和判断,不然AI是没事,但你却很可能掉坑里去了。

  AI的胜率之上,则有它无法预测的人心。人,这个复杂的变量,本就是围棋的重要组成部分。

  两位对局者在棋盘前,不仅要比拼技术的高下,同时也在进行心理上的博弈。

  所以只要还是人和人在对弈,那么围棋的乐趣就永不变。

本文文章转载自新浪新闻