專欄描述,Bell Wang 擔(dān)任 2018 年創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會(huì)議(IEID)的官方同聲傳譯人員,而當(dāng)時(shí)現(xiàn)場直播平臺“知領(lǐng)直播”的官方描述是“本次國際會(huì)議引入了科大訊飛智能語音技術(shù),實(shí)現(xiàn)了國際會(huì)議中的智能翻譯和自動(dòng)語音播報(bào)”,并未提及會(huì)議現(xiàn)場也有專職的同聲傳譯人員。
專欄貼出的現(xiàn)場圖片顯示,會(huì)議中演講者身后除了有 PPT,還有左右兩塊區(qū)域分別顯示中英文文字,專欄描述稱這是科大訊飛的“訊飛聽見”智能識別出語音后轉(zhuǎn)錄的文字。比如演講嘉賓講中文,屏幕會(huì)實(shí)時(shí)顯示該演講者的中文,以及經(jīng)過翻譯的英文,反之亦然。
但 Bell Wang 在比對屏幕上的內(nèi)容后懷疑,所謂的翻譯環(huán)節(jié)并非機(jī)器完成,所謂“AI 同傳”其實(shí)只不過是機(jī)器識別人類口譯員的翻譯后語句,再用機(jī)器轉(zhuǎn)錄為文字顯示出來。而如此一來現(xiàn)場的觀眾就會(huì)誤以為科大訊飛在做精準(zhǔn)的實(shí)時(shí)翻譯。
Bell Wang 表示科大訊飛事前沒有告訴現(xiàn)場同傳人員有語音識別的字幕,也沒有告知直播的同傳是機(jī)器朗讀現(xiàn)場同傳人員翻譯識別出來的文稿,更沒有征得同傳的同意就冒名使用了翻譯成果。
隨后這篇專欄文章獲得超過 6000 個(gè)點(diǎn)贊,文章也被轉(zhuǎn)載到知乎外的平臺傳播。有口譯工作者也提出科大訊飛的 AI 作弊早有前科,去年某場大會(huì)也發(fā)生過幾乎如出一轍的事件。
21 日,科大訊飛在一篇新聞稿中引用公司董秘江濤的回應(yīng),說 “訊飛從沒講過 AI 同傳的概念,始終強(qiáng)調(diào)是人機(jī)結(jié)合的模式。”2018 創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會(huì)議上使用的“訊飛聽見”現(xiàn)場同傳翻譯,“翻譯部分是由人類同傳譯員現(xiàn)場完成的。”
同一天科大訊飛對新浪科技回復(fù)稱,翻譯字幕上中英文同時(shí)顯示時(shí)是嵌入式機(jī)器實(shí)時(shí)全自動(dòng)同傳,單個(gè)語種顯示時(shí)是人工同傳。人工翻譯時(shí),訊飛聽見可以幫助同傳提升效率和水平。
這意思就是說,科大訊飛從未說他們過可以實(shí)現(xiàn)實(shí)時(shí)精準(zhǔn)翻譯,一開始他們的技術(shù)就只是同一種語言內(nèi)的“語音轉(zhuǎn)文字”。
科大訊飛還在新聞稿中提到官網(wǎng)公眾號 2017 年 6 月發(fā)布的一篇文章,題為 《拒絕神化 人工智能技術(shù)需踏實(shí)前行》。這篇文章稱,科大訊飛的人工智能目前還無法替代同傳,希望通過語音轉(zhuǎn)寫和翻譯技術(shù)幫助人類同傳提高工作效率。
除了以上簡短回應(yīng),科大訊飛并未對 Bell Wang 描述的未征得翻譯人員同意使用翻譯內(nèi)容,以及未在明確地方標(biāo)注內(nèi)容來自現(xiàn)場同聲傳譯等幾點(diǎn)質(zhì)疑進(jìn)行回應(yīng),也沒有明確表示 Bell Wang 所講的一切是否屬實(shí)。
科大訊飛原為“安徽中科大訊飛信息科技有限公司”,1999 年變更設(shè)立“科大訊飛股份有限公司”。2008 年科大訊飛在深圳證券交易所中小板掛牌上市,上市文件顯示公司主營業(yè)務(wù)范圍包括語音支撐軟件、行業(yè)應(yīng)用產(chǎn)品/系統(tǒng)、信息工程和運(yùn)維服務(wù)。
財(cái)報(bào)顯示,科大訊飛 2018 年上半年實(shí)現(xiàn)營業(yè)收入 32.1億元,同比增長 52.68%;凈利潤 1.3 億元,同比增長 21.74%。其中 ToC 業(yè)務(wù)(面向普通用戶)的收入超過 10 億元,同比增長率近 130%??拼笥嶏w的主要產(chǎn)品包括移動(dòng)應(yīng)用“訊飛語記”,該應(yīng)用能讓語音和文字互相轉(zhuǎn)錄,用戶需要付費(fèi)才能使用。
21 日當(dāng)天,科大訊飛股價(jià)下跌最高不到 1%。
同聲傳譯是建立在大量訓(xùn)練之上并基于人腦語言機(jī)制的一項(xiàng)工作。1919 年,在審判德國的巴黎和會(huì)上,英法兩國代表在 1000 多人的見證下首次借助同聲傳譯完成了談判過程,這也是同聲傳譯最早的一次使用。
一般而言,即使是雙語運(yùn)用自如的專業(yè)人士在同傳之前也要進(jìn)行數(shù)年左右的鍛煉,并且需要準(zhǔn)備大量的資料才能達(dá)到現(xiàn)場同傳的能力。
過去幾年,科大訊飛一直在研究語音交互技術(shù)。2017 年,科大訊飛發(fā)布第一代翻譯機(jī)“曉譯”。并表示帶有核心技術(shù)的口語即時(shí)翻譯。由于 2017 年人工智能(AI)上升為國家戰(zhàn)略后,先后有百度,搜狗等公司推出 AI 翻譯應(yīng)用和硬件等產(chǎn)品。
而當(dāng)時(shí)有大量標(biāo)題為 AI 翻譯機(jī)器取代人工翻譯的文章出現(xiàn)。科大訊飛此次引用回應(yīng)的 2017 年文章也是那個(gè)時(shí)期發(fā)表的。AI 翻譯在當(dāng)時(shí)引起了大量同傳人士的爭議,尤其是針對 AI 翻譯準(zhǔn)確度在同聲傳譯時(shí)較差,效果達(dá)不到大量文章鼓吹的程度。
原因在于盡管 AI 翻譯技術(shù)大幅提升,但與高水平翻譯所要求的“信、達(dá)、雅”之間還存在相當(dāng)大的距離。這幾年所謂的 AI 翻譯主要依托于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的技術(shù),通過大量學(xué)習(xí)文本,模仿人腦神經(jīng)思考的模式,產(chǎn)出對應(yīng)的譯文。
但在同傳方面,AI 翻譯的效果始終存在質(zhì)疑,一方面是語音識別的準(zhǔn)確性還無法做到 100% 正確,而另一方面,AI 翻譯在語法方面還存在較多的問題。
2017 年 2 月,Google 使用全新的 NMT (神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯)系統(tǒng)在韓國世宗大學(xué)與人類譯員進(jìn)行的翻譯對戰(zhàn)。在 50 分鐘內(nèi)雙方同時(shí)翻譯兩段文本。結(jié)果 NMT 并未取得較高的評分,評委指出 NMT 系統(tǒng)翻譯出的文本 90% 都存在語法方面的問題。
甚至在今年 4 月的博鰲論壇上,騰訊的同傳機(jī)器翻譯甚至將“中國的一帶一路”翻譯為“中國有一條公路和一條腰帶”。