您的位置:首頁 > 業(yè)內(nèi)資訊 > 李世石為何會輸給AlphaGo?圍棋國手古力:他輕敵了
“人機(jī)世紀(jì)大戰(zhàn)”第一局落下帷幕,李世石認(rèn)輸,這是讓很多人沒有想到的。原本被寄以厚望的李世石,到底為什么會輸于古力口中“業(yè)余六七段”的Alphago?
Alphago深度學(xué)習(xí)發(fā)揮作用
“國際象棋每步大約會出現(xiàn)35種左右的走位可能,而圍棋的走位可能則高達(dá)250種,每一步250種相乘就意味著整局比賽會出現(xiàn)多到幾乎無窮盡的走位方案!惫雀鐳eepMind實(shí)驗(yàn)室主管德米斯-哈撒比斯(Demis Hassabis)說道。Alphago在擊敗歐洲圍棋冠軍樊麾時學(xué)習(xí)了3000萬盤棋,而經(jīng)過將近半年的學(xué)習(xí),這個數(shù)量已經(jīng)增長到1億以上。
AlphaGo的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)!安呗跃W(wǎng)絡(luò)”(policy network)和“值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里,本質(zhì)上和人類棋手所做的一樣。
其中,“值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。利用蒙特卡洛擬合,將這些信息放入一個概率函數(shù),AI就不用給每一步以同樣的重視程度,而可以重點(diǎn)分析那些有戲的棋著。
這意味著Alphago屬于典型的力戰(zhàn)型棋風(fēng),善于敏銳地抓住對手的弱處主動出擊,以強(qiáng)大的力量擊垮對手。李開復(fù)先生說現(xiàn)在的AlphaGo和1997年擊敗世界象棋冠軍的深藍(lán)相比,從圍棋到象棋的難度高了很多,是難度非常大的跳升。
近年來深度學(xué)習(xí)的技術(shù),非常大的數(shù)據(jù)量和計(jì)算量可以擴(kuò)張地使用,超過了我們的想象。同時我們也對人所謂的智力,當(dāng)時有一些錯誤的幻想,實(shí)際上深度學(xué)習(xí)的成長非常快速,它可以非常好地利用更多地機(jī)器。所以在任何客觀、科學(xué)工程評估的領(lǐng)域,包括游戲,其實(shí)是金融、搜索、廣告等各方面的應(yīng)用,人類基本上不會再有更多的機(jī)會跟機(jī)器來競爭了。
小編推薦閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)