您的位置:首頁(yè) > 業(yè)內(nèi)資訊 > 計(jì)算機(jī)自學(xué)72小時(shí),已打敗國(guó)際象棋大師
他的神經(jīng)網(wǎng)絡(luò)由四個(gè)層級(jí)組成,能夠以三種不同方式共同思考棋盤上每一個(gè)位置。第一種著眼于國(guó)際象棋的全局狀態(tài),例如每邊棋子的數(shù)量和類型,輪到哪一方移動(dòng),位置對(duì)換等;第二著眼于棋子的特性,例如雙方每個(gè)棋子的位置;最后就是映射出每個(gè)棋子的攻擊和防守。
計(jì)算機(jī)自學(xué)下棋
訓(xùn)練這些機(jī)器通常采用的方法,是研究人員手動(dòng)評(píng)估每一個(gè)位置,并用這些信息指導(dǎo)機(jī)器識(shí)別出哪些步數(shù)是有效的,哪些效果沒(méi)那么好。但是,Matthew Lai的目標(biāo)更加雄心勃勃,他想讓機(jī)器自學(xué)這些內(nèi)容。
他采用了一個(gè)引導(dǎo)技術(shù),讓人工智能Giraffe自己與自己對(duì)決,從而改善對(duì)未來(lái)下棋走位的預(yù)測(cè)。在比賽勝利、失敗或打平之后,會(huì)最終確定每一步的價(jià)值。以這種方式,計(jì)算機(jī)可以了解走哪個(gè)位置是有效的,哪些位置效果不好。
在Giraffe經(jīng)過(guò)培訓(xùn)之后,最后一步就是測(cè)試它的能力是否達(dá)標(biāo)了。他用一個(gè)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)Strategic Test Suite來(lái)測(cè)試,這一數(shù)據(jù)庫(kù)可以測(cè)試改計(jì)算引擎識(shí)別不同的戰(zhàn)略構(gòu)想的能力。他將對(duì)這項(xiàng)測(cè)試的結(jié)果進(jìn)行評(píng)分,總分為15000。
整個(gè)訓(xùn)練過(guò)程中,他會(huì)測(cè)試機(jī)器的各個(gè)階段成績(jī)。當(dāng)引導(dǎo)過(guò)程開(kāi)始時(shí),Giraffe很快就達(dá)到了6000分的成績(jī),僅在72小時(shí)就達(dá)到了9700分。9700分已經(jīng)可以成為世界上最好的國(guó)際象棋引擎了。
Matthew Lai接著使用相同種類的機(jī)器學(xué)習(xí)方法,確定對(duì)方一個(gè)特定的移動(dòng)是否值得機(jī)器進(jìn)行跟隨。這一點(diǎn)很重要,因?yàn)樗梢苑乐共槐匾乃阉,極大提高計(jì)算效率。
結(jié)果表明,46%的情況下計(jì)算機(jī)所走的步數(shù)都是最好的一步,70%的時(shí)間都能走出排在前三名的好棋。因此,計(jì)算機(jī)并沒(méi)有收到對(duì)方的動(dòng)作的影響。
這一方法代表著國(guó)際象棋引擎的工作方式發(fā)生了重大變革,不過(guò)它并不完美。Giraffe的一個(gè)缺點(diǎn)是,神經(jīng)網(wǎng)絡(luò)比其他類型的數(shù)據(jù)處理速度慢得多。Giraffe花費(fèi)的時(shí)間比以往的國(guó)際象棋引擎要多耗費(fèi)約10倍。
小編推薦閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2025 haote.com 好特網(wǎng)