手机版
平平网 >> 八卦热点 >> 正文

柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗

2025-02-28 12:00来源:平平网编辑:甜甜

阿尔法狗是人工智能领域的科技成果,它的模拟原型就是人类大脑,而且阿尔法狗还集中的囊括了人类大脑所有的智慧。在围棋第一局比赛中,柯洁和阿尔法狗进行了一次对决比赛,柯洁和阿尔法狗的围棋比赛结果,比赛的结果是阿尔法狗赢了。有的网友对阿尔法狗赢得比赛感到震惊,同时也对阿尔法狗怎么赢的比赛感到费解,今天我们就深度分析下柯洁为什么输给阿尔法狗。
 
柯洁和阿尔法狗的围棋比赛结果:
 
2017年5月23日,在举行于中国乌镇的“人机终极对决”第一局中,当今世界排名第一的中国围棋选手柯洁,输给了Google旗下的人工智能程序AlphaGo。
 
柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗 
按照比赛规则,柯洁和AlphaGo各有三个小时的时间;但在现场的比赛中,整体的节奏比预想中的要快很多。尤其是AlphaGo,它的平均出子时间为30秒左右,现场解说的职业八段棋手张璇和职业九段棋手常昊多次用“高效、果断”来评价它的表现。而柯洁的应对状况比较多变,有时会立刻下子,有时也会思考很长时间。
 
最终比赛的结果也并不十分出人意料,在比赛进行了四个多小时之后,柯洁九段执黑负于AlphaGo,AlphaGo赢四分之一子。
 
柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗
 
不过,关于这场“人机终结对决”的最终结果,目前还存在一定的变数;今天只是这场对决的第一局,第二局和第三局将分别在5月25日和5月27日举行。
 
何方神圣:柯洁为什么输给阿尔法狗?
 
一场人与机器的围棋大战吸引了全世界的目光,大战之所以举世瞩目,是因为对战的双方是世界围棋冠军柯洁与围棋人工智能程序AlphaGo。令人惊叹的是,整个比赛过程中,AlphaGo的表现都堪称完美,最终击败柯洁。这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣?它为什么能赢?
 
AlphaGo程序是美国谷歌公司旗下DeepMind团队开发的一款人机对弈的围棋程序,被中国棋迷们戏称为“阿尔法狗”。游戏是人工智能最初开发的主要阵地之一,比如博弈游戏就要求人工智能更聪明、更灵活,用更接近人类的思考方式解决问题。
 
“阿尔法狗”下棋用两个神经网络大脑——策略网络和估值网络,像人类棋手一样判断当前局面,推断未来局面
 
AlphaGo通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。它们的任务在于合作‘挑选’出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。在本质上,这和人类棋手所做的是一样的。在与柯洁对阵之前,谷歌首先用人类对弈的近3000万种走法来训练“阿尔法狗”的神经网络,让它学会预测人类专业棋手怎么落子。然后更进一步,让AlphaGo自己跟自己下棋,从而又产生规模庞大的全新的棋谱。谷歌工程师曾宣称AlphaGo每天可以尝试百万量级的走法。
 
柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗 
“传统的棋类软件,一般采用暴力搜索,包括深蓝计算机,它是对所有可能结果建立搜索树(每个结果是树上的一个果实),根据需要进行遍历搜索。这种方法在象棋、跳棋等方面还具有一定可实现性,但对于围棋就无法实现,因为围棋横竖各19条线,落子的可能性大到计算机无法构建这棵树(果子太多了)来实现遍历搜索。”中国科学院自动化研究所研究员易建强说,“而AlphaGo采用了很聪明的方法,完美解决了这个问题。它利用深度学习的方法降低了搜索树的复杂性,搜索空间得到有效降低。比如,策略网络负责指挥计算机搜索出更像人类高手该落子的位置,而估值网络负责指挥计算机搜索出后续更有可能获胜的一个落子位置。”
 
AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。
 
柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗 
策略网络主要是用来生成落子策略的。在下棋的过程中,它不是考虑自己应该怎么下,而是想人类的高手会怎么下。也就是说,它会根据输入棋盘当前的一个状态,预测人类下一步棋会下在哪儿,提出最符合人类思维的几种可行的下法。”
 
然而,策略网络并不知道自己要下出的这步棋到底下得好还是不好,它只知道这步棋是否跟人类下的是一样的,这时候就需要估值网络来发挥作用了。
 
柯洁和阿尔法狗的围棋比赛结果 何方神圣:柯洁为什么输给阿尔法狗 
估值网络会为各个可行的下法评估整个盘面的情况,然后给出一个‘胜率’。这些值会反馈到蒙特卡洛树搜索算法中,通过反复如上过程推演出‘胜率’最高的走法。蒙特卡洛树搜索算法决定了策略网络仅会在‘胜率’较高的地方继续推演,这样就可以抛弃某些路线,不用一条道算到黑。
 
AlphaGo利用策略网络和估值网络这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。这就是阿尔法狗能赢的主要原因。

推荐文章

我和总裁床上动作的互动互补 炮友发展感情往往是剃头挑子一头热
我和总裁床上动作的互动互补 炮友发展感情往往是剃头挑子一头热
总裁大人体力好好啊,那一次在车上,我和总裁有了第一...
查看详情>>
李乃文个人资料简介简历 富二代显赫家世是真的吗
李乃文个人资料简介简历 富二代显赫家世是真的吗
演员李乃文受父母影响,进入娱乐圈。李乃文个人资料简...
查看详情>>
我国最吓人的蛇长什么样 1978年大蛇事件(长达50米)
我国最吓人的蛇长什么样 1978年大蛇事件(长达50米)
说起巨蛇很多人可能想到的就是网纹蟒这样的了,但其实...
查看详情>>
孟鹤堂的老婆和闫云达现状 都不知道这些流言从哪冒出来的
孟鹤堂的老婆和闫云达现状 都不知道这些流言从哪冒出来的
孟鹤堂和闫云达原本都是郭德纲的弟子,俗话说什么样的...
查看详情>>
吴亦凡现状照片现在怎么样了 为什么现在没有吴亦凡的任何消息呢
吴亦凡现状照片现在怎么样了 为什么现在没有吴亦凡的任何消息呢
吴亦凡现状照片现在怎么样了:第一个问题:吴某团队,...
查看详情>>
张云雷怎么从南京站摔下去的 南京南站事件坠台是怎么回事
张云雷怎么从南京站摔下去的 南京南站事件坠台是怎么回事
张云雷怎么从南京站摔下去的?喝多了,去车站送人,送...
查看详情>>
宋仁宗无子的真实原因 为什么宋仁宗一生没有儿子继位
宋仁宗无子的真实原因 为什么宋仁宗一生没有儿子继位
因为宋仁宗的儿子都是出生没多久便夭折,宋仁宗一共有...
查看详情>>
Copyright © 2009-2020.平平网(www.pingpingw.com) 备案号:豫ICP备10205020号