落后胡下是无法破解的bug

gwcore
2016-03-13 字数 84

除非他加入人类对弈者水平评估模块,针对不同水平对手选择策略。而不是把所有对手当成深

Weiqi 纹枰论道
68 个回复
doslong
doslong 2016-03-13

它没有胡下,其他地方是必输,它下的几个地方都有捡勺的可能,那几个地方确实胜率要高一些。

【 在 gwcore 的大作中提到: 】

: 除非他加入人类对弈者水平评估模块,针对不同水平对手选择策略。而不是把所有对手当成深

dogmanstar
一只黑熊 2016-03-13

问题是实际下棋中没有捡勺的可能。比如最后那一扑。

【 在 doslong 的大作中提到: 】

: 它没有胡下,其他地方是必输,它下的几个地方都有捡勺的可能,那几个地方确实胜率要高一些。

doslong
doslong 2016-03-13

有可能的,这也棋手也走神,今天运气不好而已。

【 在 dogmanstar 的大作中提到: 】

: 问题是实际下棋中没有捡勺的可能。比如最后那一扑。

Soloman
等发了财,我就去参悟佛经 2016-03-13

简单点,就是收益X概率这么一个权衡了。其他地方概率虽然大,但是实在是收益不能扭转整个局势,那么估值就是0,这个虽然概率极低,但是收益可以扭转,所以估值就是1.

当然我相信狗的算法会复杂很多,但是我觉得基本原因就是这样。

【 在 dogmanstar 的大作中提到: 】

: 问题是实际下棋中没有捡勺的可能。比如最后那一扑。

ruster
建议刑法设立卢瑟罪和猥琐罪 2016-03-13

有人给了一个比较搞的解释:他说狗的神经网络估值是不带遗忘的。走到送死一串黑子后,狗发现这个局面下唯一赢棋的经验就是以前自己还是10级菜鸟时候和自己的对局。。。。所以就拿上来用了。。。

应该直接忘了早期的下法就好了。

jinchen
ddwwbb 2016-03-13

不会的啊,不带遗忘的那还得了,它是小菜狗的时候,昏招多着呢。即使现在的阿发狗,放到网上让大家群殴,它把砍菜鸟的经验全记下来当法宝,那不很快被大家带到沟里去,变智障了?

【 在 ruster (建议刑法设立卢瑟罪和猥琐罪) 的大作中提到: 】

: 有人给了一个比较搞的解释:他说狗的神经网络估值是不带遗忘的。走到送死一串黑子后,狗发现这个局面下唯一赢棋的经验就是以前自己还是10级菜鸟时候和自己的对局。。。。所以就拿上来用了。。。

: 应该直接忘了早期的下法就好了。

lvsoft
Lv(The Last Guardian) 2016-03-13

神经网络本身就带一定的记忆能力,本质上是对任意函数的无限逼近能力。

不过这次的问题我认为只是看漏了而已。

后,狗发现这个局面下唯一赢棋的经验就是以前自己还是10级菜鸟时候和自己的对

局。。。。所以就拿上来用了。。。

【 在 ruster (建议刑法设立卢瑟罪和猥琐罪) 的大作中提到: 】

: 有人给了一个比较搞的解释:他说狗的神经网络估值是不带遗忘的。走到送死一串黑子

: 应该直接忘了早期的下法就好了。

lazygamer
lazygamer 2016-03-13

问题是‘天外飞仙’,搞不好也是那时候下出来的。

唯一结论就是,今天的外围暴力局部计算,不给力。

【 在 ruster 的大作中提到: 】

: 有人给了一个比较搞的解释:他说狗的神经网络估值是不带遗忘的。走到送死一串黑子后,狗发现这个局面下唯一赢棋的经验就是以前自己还是10级菜鸟时候和自己的对局。。。。所以就拿上来用了。。。

: 应该直接忘了早期的下法就好了。

ruster
建议刑法设立卢瑟罪和猥琐罪 2016-03-13

说的不是白78到黑87,是说黑在左下无法理解的挖。

【 在 lvsoft 的大作中提到: 】

: 神经网络本身就带一定的记忆能力,本质上是对任意函数的无限逼近能力。

: 不过这次的问题我认为只是看漏了而已。

: 后,狗发现这个局面下唯一赢棋的经验就是以前自己还是10级菜鸟时候和自己的对

: ...................

www4
人生幾何?譬如朝露 2016-03-13

你这说法确实很新颖

不过问题是那几个地方出勺子可能性很低啊

几乎不用计算

你让人怎么出勺子

【 在 doslong 的大作中提到: 】

: 它没有胡下,其他地方是必输,它下的几个地方都有捡勺的可能,那几个地方确实胜率要高一些。

ruster
建议刑法设立卢瑟罪和猥琐罪 2016-03-13

只有你把狗逼到胜率很低的局面才会有这个问题。

然而你觉得全球9d里面能五盘搞出一个这种局面的有十分之一吗?

【 在 jinchen 的大作中提到: 】

: 不会的啊,不带遗忘的那还得了,它是小菜狗的时候,昏招多着呢。即使现在的阿发狗,放到网上让大家群殴,它把砍菜鸟的经验全记下来当法宝,那不很快被大家带到沟里去,变智障了?

lvsoft
Lv(The Last Guardian) 2016-03-13

那个是因为博弈树上剩下的全是烂招,选了一个相对最好的吧...

【 在 ruster (建议刑法设立卢瑟罪和猥琐罪) 的大作中提到: 】

: 说的不是白78到黑87,是说黑在左下无法理解的挖。

ruster
建议刑法设立卢瑟罪和猥琐罪 2016-03-13

不是的,如果不是受到以前经验的误导,你就是什么都不走也比那个挖有意义。

唯一解释就是以前狗这么挖获得过好处。

【 在 lvsoft 的大作中提到: 】

: 那个是因为博弈树上剩下的全是烂招,选了一个相对最好的吧...

dogmanstar
一只黑熊 2016-03-13

这个可能真没有,职业棋手你最后扑吃他一串子指望他不提。未免异想天开

【 在 doslong 的大作中提到: 】

: 有可能的,这也棋手也走神,今天运气不好而已。

jinchen
ddwwbb 2016-03-13

那就更神奇了,这个的表现就类似于人类处于劣势的“慌了”,真要能这么搞,岂不是帮这条机器狗产生了情绪功能?这还得了?

【 在 ruster (建议刑法设立卢瑟罪和猥琐罪) 的大作中提到: 】

: 标  题: Re: 落后胡下是无法破解的bug

: 发信站: 水木社区 (Sun Mar 13 23:08:50 2016), 转信

: 只有你把狗逼到胜率很低的局面才会有这个问题。

: 然而你觉得全球9d里面能五盘搞出一个这种局面的有十分之一吗?

: 【 在 jinchen 的大作中提到: 】

: : 不会的啊,不带遗忘的那还得了,它是小菜狗的时候,昏招多着呢。即使现在的阿发狗,放到网上让大家群殴,它把砍菜鸟的经验全记下来当法宝,那不很快被大家带到沟里去,变智障了?

: :

: --

OrionNebula
nebula 2016-03-13

有没有可能是随机性?最优解都差不多,随机因素影响了抉择,这样大优势和大劣势都会昏招不断

【 在 ruster 的大作中提到: 】

: 不是的,如果不是受到以前经验的误导,你就是什么都不走也比那个挖有意义。

: 唯一解释就是以前狗这么挖获得过好处。

ruster
建议刑法设立卢瑟罪和猥琐罪 2016-03-13

这个可能是有的,如果是聂哥就有可能。

然而在狗的决策思路上这决策怎么鼓捣出来的?

【 在 dogmanstar 的大作中提到: 】

: 这个可能真没有,职业棋手你最后扑吃他一串子指望他不提。未免异想天开

lvsoft
Lv(The Last Guardian) 2016-03-13

那就是神经网络记住了这么做的好处,所以对这一步给了高估值。

【 在 ruster (建议刑法设立卢瑟罪和猥琐罪) 的大作中提到: 】

: 不是的,如果不是受到以前经验的误导,你就是什么都不走也比那个挖有意义。

: 唯一解释就是以前狗这么挖获得过好处。

baldur
船长,起风了 2016-03-13

在他看来对面也是狗,嗯。

【 在 www4 的大作中提到: 】

: 你这说法确实很新颖

: 不过问题是那几个地方出勺子可能性很低啊

: 几乎不用计算

: ...................