4月下旬,世界各路女子圍棋高手相聚第一屆“吳清源杯”,但似乎更加吸引棋迷目光的是世界各路機(jī)器圍棋高手云集的世界人工智能?chē)宕筚悾€有柯潔將參加的人機(jī)大戰(zhàn)表演賽。
距離柯潔與AlphaGo的人機(jī)大戰(zhàn)已經(jīng)快過(guò)去一年了。這一年時(shí)間里圍棋界發(fā)生了很大變化,也許并不太懂棋的旁觀者還體會(huì)不到這一點(diǎn),可是在圍棋職業(yè)高手和關(guān)注棋壇變化的棋迷們眼中,兩年前、一年前和現(xiàn)在的紋枰世界已經(jīng)連升三級(jí),大為不同了。要是讓2015年的柯潔穿越到今天,乍一看到最近比賽的棋譜,他恐怕要懷疑自己的眼睛以及多年所學(xué)了。
科技引領(lǐng)時(shí)代。人工智能對(duì)圍棋的探究源于機(jī)器學(xué)習(xí)技術(shù),正是因?yàn)榧尤肓松疃葘W(xué)習(xí)神經(jīng)網(wǎng)絡(luò),AlphaGo有了與人類(lèi)棋手相似的“棋感”、“形勢(shì)判斷”和“大局觀”,才能在硬件不需大突破的情況下,攻克了多年來(lái)停滯不前、很多專(zhuān)業(yè)人士預(yù)期二十年之后才可能實(shí)現(xiàn)的計(jì)算機(jī)圍棋難題。要知道,在引入機(jī)器學(xué)習(xí)技術(shù)之前,僅靠蒙特卡洛樹(shù)搜索和“專(zhuān)家知識(shí)數(shù)據(jù)庫(kù)”,計(jì)算機(jī)圍棋程序的水平只達(dá)到了被一流高手讓六子的程度,——這就是發(fā)生在AlphaGo與李世石的第一次人機(jī)大戰(zhàn)前半年的事情。
李世石與AlphaGo一戰(zhàn),左邊代AlphaGo落子者為黃士杰博士
此后,在價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)被進(jìn)一步融合為一體,AlphaGo進(jìn)化為“大師”(Master)級(jí),消除了算法中的漏洞,遠(yuǎn)遠(yuǎn)超過(guò)人類(lèi)棋手目前的最高水平,棋界普遍評(píng)估大概在讓二子至三子之間。這是一個(gè)怎樣的差距呢?
目前,職業(yè)頂尖高手與業(yè)余頂尖高手之間的差距是讓二子至讓先之間。而業(yè)余頂尖與業(yè)余一流高手之間大概有讓先左右的差距。比職業(yè)頂尖高手略強(qiáng)的國(guó)產(chǎn)圍棋人工智能“絕藝”(上一版本)經(jīng)常在網(wǎng)絡(luò)上測(cè)試與業(yè)余普通高手(大致在業(yè)余5段左右)的讓二子或讓三子棋,絕藝勝多負(fù)少。形象一點(diǎn)說(shuō),在大師版本的AlphaGo面前,職業(yè)頂尖選手大致有相當(dāng)于博爾特與高中田徑隊(duì)尖子選手的差距。
而從零開(kāi)始的AlphaGo Zero和通用棋類(lèi)人工智能AlphaZero又比大師版本的AlphaGo更強(qiáng)大。其研發(fā)團(tuán)隊(duì)的首席科學(xué)家大衛(wèi)席爾瓦認(rèn)為,這證明不依靠人類(lèi)知識(shí)自己學(xué)習(xí)的人工智能可以達(dá)到超越人類(lèi)、且在一定程度上通用的水平,算法比數(shù)據(jù)更重要。最新版本的Alpha Zero只需要在一臺(tái)單機(jī)、四個(gè)TPU上運(yùn)行,而初代的AlphaGo需要龐大的硬件集群支撐,而棋力確實(shí)新版本遠(yuǎn)強(qiáng)于舊版本,這是算法的勝利。
AlphaGo采用的技術(shù)——深度學(xué)習(xí)
介紹了這么多關(guān)于AlphaGo的技術(shù),是因?yàn)樵谒脑碌滓c柯潔進(jìn)行人機(jī)大戰(zhàn)的圍棋人工智能是國(guó)產(chǎn)、且技術(shù)不同于AlphaGo的“神秘硅基棋手”。它的名字叫“星陣”,英文名是Golaxy,這個(gè)詞源于galaxy(星系、銀河),而Go是圍棋的意思。
星陣是圍棋的別名,與木野狐、爛柯、黑白、手談、方圓、坐隱等名稱(chēng)一樣,都有典故。這款即將于柯潔對(duì)陣的圍棋人工智能以此為名,可見(jiàn)信心十足,也做了很多功課。據(jù)該項(xiàng)目的研發(fā)團(tuán)隊(duì)透露,這個(gè)名字也與所采用的技術(shù)有關(guān),而這個(gè)技術(shù)是迥異于AlphaGo采用的深度學(xué)習(xí)算法的。團(tuán)隊(duì)里有精通圍棋的人才,也有精通人工智能技術(shù)的骨干,他們對(duì)自己研發(fā)的“星陣”信心十足,認(rèn)為這會(huì)是一個(gè)里程碑。
不同于AlphaGo的星陣?
耳聽(tīng)為虛眼見(jiàn)為實(shí)。對(duì)于星陣的棋力,我們不得而知,留待二十天后的實(shí)戰(zhàn)檢驗(yàn)吧。如果星陣真的能走出一套不同于AlphaGo的路,無(wú)疑是很具價(jià)值的。因?yàn)楫?dāng)前能夠達(dá)到很高水平的幾款圍棋人工智能,都是采用了AlphaGo兩篇發(fā)表在《Nature》的論文所描述的技術(shù),頂多是在細(xì)節(jié)上略作發(fā)揮,大同小異。
雖說(shuō)成功的路未必只有一條,但星陣的不同僅僅是標(biāo)新立異,還是卓然不群,就讓柯潔這把烈火來(lái)試一試真金。其實(shí)最早在去年年底公布消息時(shí),在這次世界人工智能?chē)宕筚惿?,柯潔的?duì)手被定為“天壤”,這也是一款國(guó)產(chǎn)的圍棋人工智能,采用了AlphaGo初代版本的技術(shù),后有升級(jí)??聺嵰桓呐cAlphaGo大戰(zhàn)流淚后稱(chēng)“不會(huì)再與人工智能下棋了”的口風(fēng),同意再戰(zhàn)機(jī)器棋手。希望能夠設(shè)定一個(gè)比較充足的用時(shí),比如保留時(shí)間三小時(shí),可以讓人類(lèi)棋手更充分地思考。倘若是下快棋,人工智能的運(yùn)算速度優(yōu)勢(shì)會(huì)被放大,對(duì)人類(lèi)棋手不利。