您的位置:首頁 > 業(yè)內(nèi)資訊 > 李世石為何會輸給AlphaGo?圍棋國手古力:他輕敵了

李世石為何會輸給AlphaGo?圍棋國手古力:他輕敵了

來源:互聯(lián)網(wǎng) | 時間:2016-03-09 16:20:44 | 閱讀:67 |  標(biāo)簽: 人機(jī)圍棋   | 分享到:

“人機(jī)世紀(jì)大戰(zhàn)”第一局落下帷幕,李世石認(rèn)輸,這是讓很多人沒有想到的。原本被寄以厚望的李世石,到底為什么會輸于古力口中“業(yè)余六七段”的Alphago?

>> 詳細(xì)報道

Alphago深度學(xué)習(xí)發(fā)揮作用

“國際象棋每步大約會出現(xiàn)35種左右的走位可能,而圍棋的走位可能則高達(dá)250種,每一步250種相乘就意味著整局比賽會出現(xiàn)多到幾乎無窮盡的走位方案!惫雀鐳eepMind實(shí)驗(yàn)室主管德米斯-哈撒比斯(Demis Hassabis)說道。Alphago在擊敗歐洲圍棋冠軍樊麾時學(xué)習(xí)了3000萬盤棋,而經(jīng)過將近半年的學(xué)習(xí),這個數(shù)量已經(jīng)增長到1億以上。

李世石為何會輸給AlphaGo?圍棋國手古力:他輕敵了

AlphaGo的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)!安呗跃W(wǎng)絡(luò)”(policy network)和“值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里,本質(zhì)上和人類棋手所做的一樣。

其中,“值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。利用蒙特卡洛擬合,將這些信息放入一個概率函數(shù),AI就不用給每一步以同樣的重視程度,而可以重點(diǎn)分析那些有戲的棋著。

這意味著Alphago屬于典型的力戰(zhàn)型棋風(fēng),善于敏銳地抓住對手的弱處主動出擊,以強(qiáng)大的力量擊垮對手。李開復(fù)先生說現(xiàn)在的AlphaGo和1997年擊敗世界象棋冠軍的深藍(lán)相比,從圍棋到象棋的難度高了很多,是難度非常大的跳升。

近年來深度學(xué)習(xí)的技術(shù),非常大的數(shù)據(jù)量和計(jì)算量可以擴(kuò)張地使用,超過了我們的想象。同時我們也對人所謂的智力,當(dāng)時有一些錯誤的幻想,實(shí)際上深度學(xué)習(xí)的成長非常快速,它可以非常好地利用更多地機(jī)器。所以在任何客觀、科學(xué)工程評估的領(lǐng)域,包括游戲,其實(shí)是金融、搜索、廣告等各方面的應(yīng)用,人類基本上不會再有更多的機(jī)會跟機(jī)器來競爭了。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點(diǎn)或證實(shí)其描述。

相關(guān)視頻攻略

更多

掃二維碼進(jìn)入好特網(wǎng)手機(jī)版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)