5 月 23 日至 27 日谷歌人工智能將與柯潔九段在烏鎮(zhèn)圍棋峰會(huì)對(duì)弈
wujiai
柯潔在發(fā)布會(huì)現(xiàn)場。本文圖片均由澎湃新聞?dòng)浾邚垖幣臄z
屆時(shí),他除了與目前世界排名第一的柯潔進(jìn)行三局比賽外,還將參加峰會(huì)安排的人機(jī)配對(duì)和團(tuán)體賽。
根據(jù)谷歌中國給出的比賽時(shí)間,柯潔與王雪燕將在5月23日、25日、27日進(jìn)行三場比賽,雙方每人比賽時(shí)間為3小時(shí),有5個(gè)一分鐘倒計(jì)時(shí)。
5月26日舉行的人機(jī)配對(duì)賽中,顧立與連笑兩人將互相對(duì)戰(zhàn),但每位選手都會(huì)有一位隊(duì)友輪流與其出招,真正體現(xiàn)了一起學(xué)**的真諦。
在5月24日舉行的團(tuán)體賽中,我國五位世界冠軍石樾、羋昱廷、湯韋星、陳耀曄、周睿羊?qū)⒔M隊(duì)進(jìn)行團(tuán)隊(duì)對(duì)決,建立棋手“神經(jīng)網(wǎng)絡(luò)”,減少心理因素的影響,共同考驗(yàn)面對(duì)組合風(fēng)格時(shí)展現(xiàn)出的創(chuàng)造力和應(yīng)變能力。
柯潔威脅:堅(jiān)持信念,一定贏
發(fā)布會(huì)上,谷歌大中華區(qū)總裁施孟表示:“我們一定要把帶到中國,中國是圍棋的發(fā)源地,有很多優(yōu)秀的棋手。谷歌CEO和聯(lián)合創(chuàng)始人都非常支持把帶到中國,這將讓人們思考圍棋的未來走向何方,人工智能又將走向何方。峰會(huì)期間,我們還將舉辦人工智能論壇,共同探討AI技術(shù)!
由柯潔率領(lǐng)的人類棋手代表團(tuán)將于5月與對(duì)決。
本屆比賽棋隊(duì)領(lǐng)隊(duì)柯潔在發(fā)布會(huì)上表達(dá)了自己的決心:“一定要打。
“很多走法和絕妙的思路給我們帶來了很多啟發(fā)和享受。半年前我就知道這個(gè)消息,能和對(duì)弈是我的榮幸,能代表人類對(duì)弈是不可想象的,我會(huì)盡全力去贏!笨聺嵳f:“這個(gè)團(tuán)隊(duì)是一支非常了不起的團(tuán)隊(duì),會(huì)對(duì)我們棋手產(chǎn)生非常長遠(yuǎn)的影響,能給人類的未來帶來奇妙的變化。我站在歷史變革的節(jié)點(diǎn)上,我不會(huì)輕易妥協(xié),不會(huì)說人機(jī)一起贏,我會(huì)有必勝的心態(tài),有一定要贏的信念,一定要打。
2016年3月,他以4比1的總比分戰(zhàn)勝韓國棋手李世石,引起轟動(dòng)。賽后,韓國棋院還授予他九段榮譽(yù)證書。當(dāng)時(shí),柯潔曾“宣稱”愿意與他對(duì)弈。
如何訓(xùn)練?
近日,升級(jí)版游戲以“/”為名與世界頂級(jí)圍棋選手進(jìn)行了60盤快棋對(duì)弈,全部獲勝,此次升級(jí)為下個(gè)月的“較量”增添了懸念。
谷歌表示,為應(yīng)對(duì)圍棋巨大的復(fù)雜性,采用了一種新穎的機(jī)器學(xué)**技術(shù),該技術(shù)融合了監(jiān)督學(xué)**和強(qiáng)化學(xué)**的優(yōu)點(diǎn)。通過訓(xùn)練柯潔將戰(zhàn)阿爾法狗,形成一個(gè)策略網(wǎng)絡(luò)( ),該網(wǎng)絡(luò)以棋盤上的情況作為輸入信息,為所有可行位置生成概率分布。然后,訓(xùn)練一個(gè)價(jià)值網(wǎng)絡(luò)( value )來預(yù)測自我對(duì)局,以-1(對(duì)手絕對(duì)勝利)到1(絕對(duì)成功)的標(biāo)準(zhǔn)預(yù)測所有可行位置的結(jié)果。這兩個(gè)網(wǎng)絡(luò)本身都非常強(qiáng)大,將這兩個(gè)網(wǎng)絡(luò)集成到基于概率的蒙特卡洛樹搜索( MCTS )中才能發(fā)揮其真正的優(yōu)勢(shì)。最后,新版本生成大量自我對(duì)局棋局,為下一代版本提供訓(xùn)練數(shù)據(jù),這個(gè)過程不斷重復(fù)。
集成強(qiáng)大的戰(zhàn)略網(wǎng)絡(luò)()和價(jià)值網(wǎng)絡(luò)(價(jià)值)。
在獲得棋局信息后,策略網(wǎng)絡(luò)會(huì)探索哪些位置既有高潛在價(jià)值,又有高概率,進(jìn)而確定棋子的最佳放置位置。在分配的搜索時(shí)間結(jié)束時(shí),系統(tǒng)在模擬過程中檢查次數(shù)最多的位置將成為最終選擇。在經(jīng)過最初的全面探索和過程中對(duì)最佳走法的不斷推測后,搜索算法可以在其計(jì)算能力中添加類似人類的直覺判斷。
它會(huì)基于策略網(wǎng)絡(luò),探索哪個(gè)位置既有較高的潛在價(jià)值,又有較高的概率,然后決定放置棋子的最佳位置。








