您的位置:首頁 > 業(yè)內(nèi)資訊 > 計(jì)算機(jī)自學(xué)72小時(shí),已打敗國際象棋大師

計(jì)算機(jī)自學(xué)72小時(shí),已打敗國際象棋大師

來源:雷鋒網(wǎng) | 時(shí)間:2015-09-16 20:15:27 | 閱讀:117 |  標(biāo)簽: 國際象棋   | 分享到:

他的神經(jīng)網(wǎng)絡(luò)由四個(gè)層級(jí)組成,能夠以三種不同方式共同思考棋盤上每一個(gè)位置。第一種著眼于國際象棋的全局狀態(tài),例如每邊棋子的數(shù)量和類型,輪到哪一方移動(dòng),位置對(duì)換等;第二著眼于棋子的特性,例如雙方每個(gè)棋子的位置;最后就是映射出每個(gè)棋子的攻擊和防守。

計(jì)算機(jī)自學(xué)下棋

訓(xùn)練這些機(jī)器通常采用的方法,是研究人員手動(dòng)評(píng)估每一個(gè)位置,并用這些信息指導(dǎo)機(jī)器識(shí)別出哪些步數(shù)是有效的,哪些效果沒那么好。但是,Matthew Lai的目標(biāo)更加雄心勃勃,他想讓機(jī)器自學(xué)這些內(nèi)容。

他采用了一個(gè)引導(dǎo)技術(shù),讓人工智能Giraffe自己與自己對(duì)決,從而改善對(duì)未來下棋走位的預(yù)測。在比賽勝利、失敗或打平之后,會(huì)最終確定每一步的價(jià)值。以這種方式,計(jì)算機(jī)可以了解走哪個(gè)位置是有效的,哪些位置效果不好。

在Giraffe經(jīng)過培訓(xùn)之后,最后一步就是測試它的能力是否達(dá)標(biāo)了。他用一個(gè)標(biāo)準(zhǔn)數(shù)據(jù)庫Strategic Test Suite來測試,這一數(shù)據(jù)庫可以測試改計(jì)算引擎識(shí)別不同的戰(zhàn)略構(gòu)想的能力。他將對(duì)這項(xiàng)測試的結(jié)果進(jìn)行評(píng)分,總分為15000。

計(jì)算機(jī)自學(xué)72小時(shí),已打敗國際象棋大師

整個(gè)訓(xùn)練過程中,他會(huì)測試機(jī)器的各個(gè)階段成績。當(dāng)引導(dǎo)過程開始時(shí),Giraffe很快就達(dá)到了6000分的成績,僅在72小時(shí)就達(dá)到了9700分。9700分已經(jīng)可以成為世界上最好的國際象棋引擎了。

Matthew Lai接著使用相同種類的機(jī)器學(xué)習(xí)方法,確定對(duì)方一個(gè)特定的移動(dòng)是否值得機(jī)器進(jìn)行跟隨。這一點(diǎn)很重要,因?yàn)樗梢苑乐共槐匾乃阉鳎瑯O大提高計(jì)算效率。

結(jié)果表明,46%的情況下計(jì)算機(jī)所走的步數(shù)都是最好的一步,70%的時(shí)間都能走出排在前三名的好棋。因此,計(jì)算機(jī)并沒有收到對(duì)方的動(dòng)作的影響。

這一方法代表著國際象棋引擎的工作方式發(fā)生了重大變革,不過它并不完美。Giraffe的一個(gè)缺點(diǎn)是,神經(jīng)網(wǎng)絡(luò)比其他類型的數(shù)據(jù)處理速度慢得多。Giraffe花費(fèi)的時(shí)間比以往的國際象棋引擎要多耗費(fèi)約10倍。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點(diǎn)或證實(shí)其描述。

國際象棋 1.0
國際象棋 1.0
類型:經(jīng)營策略  運(yùn)營狀態(tài):正式運(yùn)營  語言:中文   

游戲攻略

游戲禮包

游戲視頻

游戲下載

游戲活動(dòng)

《國際象棋》是武漢市多比特信息科技有限公司開發(fā)的一款經(jīng)典的策略游戲,在線實(shí)時(shí)匹配真人玩家進(jìn)行對(duì)弈,

相關(guān)視頻攻略

更多

同類最新

更多

掃二維碼進(jìn)入好特網(wǎng)手機(jī)版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號(hào)!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]

湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2024 haote.com 好特網(wǎng)