微軟自然語言和機(jī)器翻譯工作的技術(shù)專家黃學(xué)東(Xuedong Huang)稱,這是最具挑戰(zhàn)性的自然語言處理任務(wù)的重要里程碑之一。
機(jī)器翻譯是科學(xué)家和技術(shù)人員們數(shù)十年來研究的課題,在此前很多時(shí)間里,專家們認(rèn)為機(jī)器永遠(yuǎn)無法做到像人那樣說話與對(duì)話。微軟機(jī)器翻譯團(tuán)隊(duì)試圖證明當(dāng)使用中文和英文語言對(duì)話時(shí),AI 可以表現(xiàn)得像人一樣自然,目前他們獲得了初步的成果。
但這一里程碑并不代表研究人員已經(jīng)解決了機(jī)器翻譯的問題,相反,未來還要面臨大量挑戰(zhàn),微軟打算先著手在實(shí)時(shí)新聞報(bào)道上(中英文)測(cè)試這個(gè) AI,等 AI 成長(zhǎng)得足夠好之后,就會(huì)進(jìn)入模仿人類對(duì)話式的中英互譯,同時(shí)也會(huì)開發(fā)其他語種的 AI 智能翻譯。
從歷史上看,曾經(jīng)主流的機(jī)器學(xué)習(xí)技術(shù)在行業(yè)中應(yīng)用是統(tǒng)計(jì)機(jī)器翻譯 (SMT)。SMT 使用先進(jìn)的統(tǒng)計(jì)分析,從一句話中上下文的幾個(gè)詞中來估計(jì)最佳可能的翻譯。SMT 自 20 世紀(jì)中期以來的為所有主要翻譯服務(wù)提供商所使用,其中包括微軟。隨著基于深度神經(jīng)網(wǎng)絡(luò)(NN) 的翻譯技術(shù)的出現(xiàn),帶動(dòng)了機(jī)器翻譯技術(shù)的突變,顯著提高了翻譯質(zhì)量,這種新的翻譯技術(shù)在 2016 年的下半年開始大規(guī)模部署使用,這使得研究人員們能夠創(chuàng)造更流利,自然的翻譯。
微軟的中英翻譯 AI 基礎(chǔ)方法是雙重學(xué)習(xí)——將中文譯成英文,再將英文譯回中文來確保翻譯結(jié)果的準(zhǔn)確度,并允許 AI 從自己的錯(cuò)誤中學(xué)習(xí)并改進(jìn)結(jié)果。AI 還會(huì)在重復(fù)翻譯的過程中,根據(jù)用戶的編輯和修改操作,學(xué)會(huì)自主編輯和修改翻譯結(jié)果。這樣將保證翻譯結(jié)果的準(zhǔn)確性,語法上也不會(huì)再出現(xiàn)顛三倒四的奇怪錯(cuò)誤,語句也不再充斥著一股機(jī)翻味。
在很好地解決準(zhǔn)確性之后,研究團(tuán)隊(duì)下一波會(huì)考慮讓 AI 翻譯更接近于人類,比如賦予更多抒情性和情景交談能力。預(yù)計(jì)當(dāng)人工智能在翻譯領(lǐng)域充分發(fā)展之后,將取代大部分新聞、說明、規(guī)范文件等的翻譯工作。