她就是比利時圍棋AI“麗拉·元”。
活躍的人工智能(AI)軟件戰(zhàn)勝職業(yè)圍棋強(qiáng)手如今已不是什么新鮮事,但和其他AI有所區(qū)別的是,這個“背景單薄”但卻極富互聯(lián)網(wǎng)精神的圍棋AI正走在一條公眾參與、開放共享的新路上。
一人之力重塑“阿爾法元”
《自然》雜志于2017年10月刊登的論文《無須人類知識掌握圍棋》是“麗拉·元”最為雄厚的“后臺”。除此之外,比利時程序員吉安·卡洛·帕斯庫托幾乎是“單槍匹馬”地在圍棋界之外開疆拓土。
這篇揭示了“阿爾法狗”的“后輩”“阿爾法元”如何“自學(xué)成才”的論文指導(dǎo)了帕斯庫托的編程。他說:“麗拉·元是對論文里介紹的系統(tǒng)的忠實(shí)‘重現(xiàn)’。”
現(xiàn)年35歲的帕斯庫托上次認(rèn)真下圍棋還是在19歲時。而即使是在當(dāng)時的棋力巔峰期,水平也十分業(yè)余。
盡管一直生活在圍棋氛圍淡薄的西歐,也沒有任何利益驅(qū)動,他卻花了大量時間在圍棋AI上:在“麗拉·元”之前,他在兩年時間里每晚花費(fèi)約一個半 小時開發(fā)了被認(rèn)為接近職業(yè)圍棋水準(zhǔn)的“麗拉”——在答復(fù)記者詢問時,帕斯庫托表示,“麗拉”是個女性名字,所以應(yīng)該用“她”的稱呼。
盡管只能利用工作和照顧兩個孩子之外的業(yè)余時間,帕斯庫托仍然在“麗拉·元”里實(shí)現(xiàn)了“阿爾法元”最大的特色:從一個對圍棋完全沒有任何了解的“神經(jīng)網(wǎng)絡(luò)”開始,通過與一種強(qiáng)大的搜索算法的結(jié)合,她可以通過自我對弈而不斷學(xué)習(xí)提高。
網(wǎng)絡(luò)對弈平臺弈客圍棋的創(chuàng)始人兼首席執(zhí)行官傅奇軒說:“麗拉·元”每天都在進(jìn)步,目前達(dá)到職業(yè)水準(zhǔn)沒有問題。
分布式參與超過預(yù)期
為了較快地提升棋力,“麗拉·元”必須經(jīng)過大量的自我對弈訓(xùn)練。
帕斯庫托能學(xué)習(xí)、借鑒的是谷歌“深度思維”團(tuán)隊(duì)在論文中提出的原理,但他卻遠(yuǎn)沒有后者所掌握的人財物資源,而這使得重塑“阿爾法元”的任務(wù)面臨了一個極大障礙。
自我對弈訓(xùn)練的一個前提是須要有很強(qiáng)的計算能力供AI調(diào)用,而帕斯庫托在這一方面則比谷歌“深度思維”差得太遠(yuǎn)。據(jù)他自己估算,如果想計算出“阿爾法元”使用的關(guān)鍵參數(shù),憑市面上常見的電腦硬件大概需要1700年。
為此,帕斯庫托采取了“分布式計算”的解決方法:任何人都可以下載“麗拉·元”到自己的電腦上,利用閑置的計算能力——尤其是顯卡——讓她自我對弈訓(xùn)練以提高水平。
自2017年11月10日以來,“麗拉·元”已自我對弈了570多萬盤,來自全球的參與和支持也超乎帕斯庫托的想象。2017年10月20日, 他曾寫下這樣的預(yù)測:“現(xiàn)實(shí)地看,大概會有十個人參與,如果非常幸運(yùn)的話,大概能有八十人參與。”但2018年3月底,他則告訴記者,平均每天參與分布式 計算的人數(shù)大約有500,而任何時候聯(lián)機(jī)參與的人數(shù)都沒有低于200。
“徹底開放”寫下濃墨重彩
帕斯庫托并不太了解“絕藝”、“深禪”等其他知名圍棋AI,但他的“麗拉·元”有兩個與眾不同的特征。
首先,“麗拉·元”堅(jiān)持不加入任何人類的圍棋知識,完全做到從零開始。這不僅是為了對標(biāo)“阿爾法元”。他解釋說:“如此就可以對比沒有人類知識 的招數(shù),與人類最高水平的招數(shù),在哪些地方是重合的。而兩者間的差異,對于人類圍棋選手來說也將很有意思。如果一旦加入人類知識的話,可能就沒有這個(比 較的)機(jī)會了。”
其次,“麗拉·元”的源代碼是完全開放的。帕斯庫托說,一些AI團(tuán)隊(duì)并不把他們的工作公開發(fā)布出來,所以大家并不知道他們采用了哪些方法,而長 此以往下去,(這對大家)又有多大意義呢?谷歌“深度思維”開發(fā)出的程序擊敗了人類世界冠軍,但對于人類圍棋選手來說,他們能研究到的這款A(yù)I的棋譜是十 分有限的,那么這對他們來說又有多大意義呢?
“我已經(jīng)把(‘麗拉·元’的)一切都開放了,所以其他人是可以繼續(xù)這份工作的。”帕斯庫托說。
“谷歌論文的出現(xiàn),推動了整個圍棋AI行業(yè)的大變革,但是‘麗拉·元’這個項(xiàng)目的意義仍然是非常特殊的,它的開源精神和全民參與性注定成為圍棋史上濃墨重彩的一筆。”傅奇軒說。