近日,谷歌人工智能研究院發(fā)布了一篇新論文,論文中介紹他們訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò)來理解網(wǎng)頁的結(jié)構(gòu),以及它在填寫機(jī)票預(yù)訂單或社交媒體網(wǎng)站交互時可以作出選擇。
據(jù)介紹,這項(xiàng)研究采用了與谷歌AlphaZero軟件相同的機(jī)器學(xué)習(xí)類別,即所謂的“強(qiáng)化學(xué)習(xí)”,在RL中,神經(jīng)網(wǎng)絡(luò)都在嘗試解決問題的每個階段,會置頂步驟策略。研究人員想出一種方法來訓(xùn)練神經(jīng)網(wǎng)絡(luò),可以讓神經(jīng)網(wǎng)絡(luò)找到一個具有眾多變量的問題解決方案。目前有兩種新型神經(jīng)網(wǎng)絡(luò),一種叫QWeb,它學(xué)習(xí)點(diǎn)擊鼠標(biāo)并在網(wǎng)頁上輸入內(nèi)容,另一種叫INET,它是指導(dǎo)者,它會指出每一步該給QWeb哪些指令。