請各位親愛的讀者朋友記得,所有沒有給出時間期限的科技預(yù)測那都是在耍流氓。
當一款新的技術(shù),不,應(yīng)該說當一個技術(shù)出現(xiàn)了一丁點欣喜的進步時,現(xiàn)在科技圈里就立刻往它的身上貼上各種“顛覆”的標簽。
如果你是一位科技新聞的讀者,想必已經(jīng)對“顛覆”這個字眼感到些許的麻木甚至惡心了吧?那天翻地覆的變化似乎就要出現(xiàn)在明天。
科技媒體善于吸引人們目光,這固然是從業(yè)人員的一種必備本領(lǐng),但如今所有人都左顧右盼,像是熱鍋上的螞蟻一樣焦躁不安,這真的是正常現(xiàn)象嗎?科技媒體眼中??萍紕?chuàng)新把世界世界攪的天翻地覆。沒事兒三天一創(chuàng)新,五天一顛覆,未來我們在這個世界站穩(wěn)腳跟的著力點又是在哪里呢?
在這其中,尤其是以圍繞著“人工智能”的呼聲最為洶涌澎湃。前不久,Google 推出了基于神經(jīng)網(wǎng)絡(luò)而開發(fā)的全新的 Google Translate,引起業(yè)界的一片驚呼。不少人甚至都建議國家完全沒有必要在開設(shè)外語專業(yè)了,翻譯就此在機器學(xué)習(xí)的帶動下徹底消失了!
然而事實上,如果我們站的遠一些去看它,如果還模糊不清就再在額頭上貼個冰塊兒,你就會發(fā)現(xiàn)任何有關(guān)“機器將取代人工翻譯”的言論都是無稽之談。今天,五十度硅會好好地跟大家掰扯掰扯為什么機器代替不了人工的翻譯,并由此我們可以稍微聊一聊人與機器究竟應(yīng)該保持這樣的一種關(guān)系。
Google 的神經(jīng)網(wǎng)絡(luò)翻譯究竟是怎么一回事?
事實上,十年之前網(wǎng)絡(luò)上就已經(jīng)提供在線翻譯服務(wù)了,而其實在很早以前,關(guān)于“機器即將替代人類進行翻譯”的論調(diào)就不絕于耳。而之所以如今大家的目光再次回到這上面,完全是因為 Google 將自己的在線翻譯服務(wù)進行了升級換代,推出了一款名為基于“神經(jīng)網(wǎng)絡(luò)”的機器翻譯系統(tǒng)。
咱們先說說什么是“神經(jīng)網(wǎng)絡(luò)”?
自打有了計算機以來,努力讓機器智能逐漸向人類大腦過渡成為了很多科研人員的一個夢想。但直到如今,在這方面的進展幾乎可以用紋絲不動來形容。人們都清楚,機器和人類的側(cè)重點不一樣。在機器眼中不費吹灰之力的運算,邏輯判斷,這在人類來看是需要大量腦力才能完成的事,而對于人類來說,那些輕而易舉就能辦到的事,比如辨識物體,人們的身份,自由流暢的語言溝通,迅速地學(xué)習(xí)并適應(yīng)某一種方言,這些對于機器來說簡直是不可能完成的任務(wù)。
在好幾次向“人腦”發(fā)起沖鋒未果之后,研究人員提出設(shè)想,為什么我們不搭建一個類似于人腦一樣的神經(jīng)網(wǎng)絡(luò)呢?讓計算機運算單位之間的關(guān)系搭建,就完全按照人腦來設(shè)計。雖然,
人類至今尚未明白人腦的工作原理,不過這沒關(guān)系,我們可以先復(fù)制出一個人腦的計算模型:一件事情并非像計算機程序那樣輸入指令輸出結(jié)果,而是在人腦的多個神經(jīng)元傳遞,每個神經(jīng)元都對信息進行自己的加工,最后輸出的結(jié)果。計算機科學(xué)家用同樣的方式,在輸入和輸出之間,加入了非常多的“節(jié)點”,每個節(jié)點會對前一個節(jié)點傳來的數(shù)據(jù),按照自己擁有的一個權(quán)重系數(shù)進行加工,有時候節(jié)點還會分層。這就是“人工神經(jīng)網(wǎng)絡(luò)”(Artificial Neural Networks,ANN)。
那么,Google 搞得這次基于神經(jīng)網(wǎng)絡(luò)的機器翻譯系統(tǒng)又是怎么一回事呢?
之前我們經(jīng)常用到的翻譯服務(wù),其實是基于“詞組”來進行的。也就是說,一段文字出現(xiàn)之后,系統(tǒng)會直接把這段文字給拆散了,最小單位就是“詞組”,然后將每個詞組找到相對應(yīng)的翻譯版本,再進行次序的調(diào)整,最后出來一篇譯文。這是一個有著明確的先后次序的翻譯工作,即:打散、找對應(yīng)的詞組、排序、其中包括了標點符號的重新分割,整理等多個環(huán)節(jié)。
按道理來說它其實不怎么容易出錯,但是每一個環(huán)節(jié)雖然準確率還蠻高,但是架不住環(huán)節(jié)多啊,一旦有一個地方出現(xiàn)了偏差,后面就如倒掉的積木一樣全部都散了架了,最后出來的翻譯內(nèi)容當然不忍猝讀。
而基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng),直接跳過了這么多繁瑣的步驟,它直接直接依靠“海量數(shù)據(jù)”來獲勝,也就是說它直接建立起來了兩個對應(yīng)著的平行語言庫,然后讓機器自己去學(xué)習(xí)如何進行對應(yīng)。這樣的法子其實很早就出現(xiàn)了,但是它也有一定的技術(shù)難題沒有攻破,比如說機器學(xué)習(xí)起來速度實在非常慢,而且稍微碰上一些沒怎么見過的話,它就不知道該怎么辦了,但是 Google 這次通過技術(shù)創(chuàng)新,讓它無論在翻譯的準確性和速度上都獲得了大大的提升。
由此,翻譯再也不是簡單的詞與詞,詞組與詞組的對應(yīng),而是能夠從一段文章的角度去把握全文,這樣出來的譯文更加流暢自然。
那么,這是不是就意味著人類翻譯在此下崗了呢?
既然我們現(xiàn)在知道了 Google 翻譯在此取得的重大進展,那么現(xiàn)在是時候把機器和人類放在翻譯的天平上稱稱斤兩,比較一下孰輕孰重了!
首先第一點:翻譯是一件非常困難的工作,有些翻譯甚至是極具翻譯才華的人都無法勝任。
機器之所以無法取代專業(yè)譯員,其實道理很簡單:現(xiàn)在在國外生活,能夠自由使用兩國語言的人那么多,但并不意味著他們就能提供專業(yè)的翻譯服務(wù)。
對于很多翻譯工作來說,翻譯所要求的并不僅僅是你需要熟悉兩國國家的語言文字。很多人覺得翻譯無非就是將兩種語言字對字,詞對詞,句對句的對應(yīng)起來,其實并非如此。譯員也不是一本會行走的“活字典”。
更準確的說,他們是兩種文化之間的橋梁,在他們大腦對信息的消化、加工、過濾之后,語言不僅僅是從形式上變得熟悉,而在文化上面也盡可能地貼近。有些時候,他們甚至?xí)l(fā)明創(chuàng)造一些說法,使得人們更容易接受,有些譯員有可能傾其一生,將在兩個不同的國家的生活經(jīng)驗灌注到翻譯工作中,使得兩種文化能夠更好的交融。而機器,是無法做到這一些的。
2、翻譯質(zhì)量沒有單一標準。
就算是機器通過了上面這一道關(guān)卡的考驗,能夠輕松承擔(dān)起各項翻譯工作,但是它的翻譯質(zhì)量是否有一個標準進行衡量呢?顯然是沒有的。你將一段文本交給 100 個人類譯員,他們會給你一百種不同的版本,哪種翻譯質(zhì)量高?哪種低?有的也許在行文造句上極為優(yōu)美流暢,有的則是在邏輯論證上面十分的嚴謹正式,在面對不同的對象,不同的環(huán)境時,考量的標準是不一樣的。而人與人之間的交流效果,是無法通過機器來實現(xiàn)單一標準劃定的。
它并不是一場象棋比賽,擁有非??陀^的邏輯推理。之所以有多個翻譯版本,影響因素除了語法上的考量,還有語言深意的側(cè)重點,哪怕是同樣一句話,在不同的人那里讀起來,因為語調(diào)、語氣等原因,也會呈現(xiàn)微妙的區(qū)別。
3、世界上的語言種類太多了,遠超過你的想象。
現(xiàn)在的 Google Translat 支持翻譯 80 種語言,但是如今在我們的世界上,還存在著 6000 到 7000 種語言,其中 2000 種雖然瀕臨滅絕,但我們就算是拿保守估計來算,這其中有 1000 種語言在經(jīng)濟層面具有重要影響力,那么 Google 即還得去征服 920 種語言,就算是每年 Google 的翻譯能力擴張 10 種語言,那么 92 年之后,Google 翻譯才算是勉強覆蓋了人類的語言圖譜。
4、語境是關(guān)鍵。
就拿英語來舉例子好了,幾乎沒人知道,一個單一的詞匯會有幾百種的意思,這完全取決于當時說話的語境是什么。事實上,牛津英語詞典中光是“Run”這一個單詞,就至少有 645 種不同的意思。一臺電腦真的不僅僅能在一種語言中識別這么多的意思,而且還能在兩種語言中找到一一對應(yīng)關(guān)系嗎?
換句話說,詞與詞對應(yīng)的翻譯是不現(xiàn)實的,真正的翻譯不是從“字詞”去著眼,而是將“語境”和“意義”兩者結(jié)合起來。而這兩者結(jié)合起來的方式還在不斷地發(fā)生著變化,這種變化背后的動因,則是來源于人們大腦無限的創(chuàng)意。機器,在短時間內(nèi)是無法跟得上這個步伐的。
5、商業(yè)開發(fā)領(lǐng)域,語言真的是太重要了,其重要程度決定了翻譯必須依賴于人類。
你的公司在描述你的產(chǎn)品和服務(wù)的時候,你知道你所采用的語言扮演多么重要的角色嗎?顧客們在做購買決策的時候,與這些話之間會產(chǎn)生千絲萬縷的聯(lián)系。在商業(yè)宣傳的翻譯領(lǐng)域,機器是否能夠達到俘獲人心的作用呢?
一家大公司在施展自己的全球化戰(zhàn)略時,勢必要進行很多本土化的營銷工作,這些翻譯工作必須依賴于人來完成,因為只有人,才能說出貼合人心的話。(這個判斷至少在我們有生之年是成立的。)
所以,鑒于以上的幾點原因,機器翻譯在短時間內(nèi)是不會顛覆翻譯這個領(lǐng)域,那么為什么每次科技界有一點點的動靜,全世界的人都在慶賀,好像明天翻譯就被機器取代了似的?
最后的話
請各位親愛的讀者朋友記得,所有沒有給出時間期限的科技預(yù)測那都是在耍流氓。在沒有時間框架的制約下,科技小編們的想象力就像是蝴蝶一樣紛飛,這樣的場景固然美麗,但是蝴蝶所到之處灑下來的,卻是不必要的恐慌和焦慮。
“顛覆”和“取代”,這樣的詞內(nèi)含著一種非此即彼,簡單粗暴的邏輯,它描繪起來快速省事兒,直接刺激大腦皮層的快感;但是現(xiàn)實往往是影響,融合,改變,這樣的過程復(fù)雜且充滿變數(shù),而我們所面對的世界往往總是如此,人與機器如何能夠更好的協(xié)作分工,這才是每個人應(yīng)該思考的問題以及努力的方向。
最后,還是說回到我們這片文章的主題:機器是否能夠替代人工翻譯?其實“不能替代”的核心原因只有一個:文化與文化相互之間的學(xué)習(xí),融合,只有通過“人”這個媒介才能完成。機器只是翻譯領(lǐng)域一個更加趁手的工具而已。正如電子商務(wù)的出現(xiàn)無法替代人工銷售。哪怕是持有同樣一種語言的人,銷售有時候還是憑借人本身才能完成的。
本文作者花滿樓,文章首發(fā)于今日頭條、微信:50度硅-面向上層精英的早午餐讀物。未經(jīng)直接授權(quán)禁止轉(zhuǎn)載(標注出處也不可以),如需轉(zhuǎn)載,請與微信號t2ipo001聯(lián)系,并注明來意。