2014年,大數(shù)據開始由概念走向應用,并因此推動各行業(yè)進軍互聯(lián)網出現(xiàn)跨越式發(fā)展,大數(shù)據中迸發(fā)商機和創(chuàng)造價值的能力越來越凸顯。隨著各種基于數(shù)據的商業(yè)模式被設計出來,大數(shù)據將在全球、全社會的各個領域,如金融、制造、能源、商貿、物流、農業(yè)、語言服務等方面不斷走向實用。
在這個追求速度第一的信息時代,人工翻譯的高成本和低產出已無法滿足市場巨大的翻譯量以及快速翻譯的需求。
翻譯行業(yè)也經過了多年蛻變,為了向國際化靠攏,滿足翻譯市場中各個角色不斷進化的需求,對于用戶來說,對翻譯速度、翻譯數(shù)量、翻譯質量的要求,或譯者和專家對翻譯資源零散、匱乏;翻譯學習;翻譯工具等的需求,語言服務這一項傳統(tǒng)行業(yè)為了更好的與時俱進,將創(chuàng)新科技融入語言服務領域,與大數(shù)據、云計算完美融合才是未來發(fā)展趨勢。
在各類使用人群市場需求和互聯(lián)網技術的日新月異推動了傳統(tǒng)語言產品與服務的發(fā)展,并催生了一批建立在新的語言處理技術上的新產品,如Google新開發(fā)的譯圖技術、Skype推出的多語即時聊天功能等,譯庫也是在此浪潮的推動下應運而生的開放式語言資產工具平臺。
譯庫區(qū)別于市面上單一翻譯等產品,最亮點體現(xiàn)于通過大數(shù)據、云計算、深度學習等核心技術,進行資源整合,解決一直阻礙著商業(yè)效能提高的數(shù)據孤島問題。譯庫是為了譯者和語言愛好者提供的開放式、系統(tǒng)化翻譯工具包,它融合了以往單一語言服務產品的功能和特點,通過提供完善的免費工具、開放共享的資源為互聯(lián)用戶提供更加高效便捷的服務,滿足市場快速、高效、高質的翻譯需求,推動語言服務業(yè)的創(chuàng)新發(fā)展。
譯庫主要包括機器翻譯、CAT輔助翻譯、平行文本、語言資產管理四大工具,其功能特點主要有以下四個方面:
1.分領域多語機器翻譯
譯庫為譯者提供分專業(yè)領域的機器翻譯,在專業(yè)語料大數(shù)據的支持下進一步提高翻譯質量。與此同時,用戶還可以修正機器翻譯的結果,譯庫能夠自動學習用戶貢獻的正確知識,在今后的翻譯中繼續(xù)提高翻譯質量。
2.開放式語言資產共享
平行語料庫、術語庫、翻譯記憶庫等都是語言資產的管理的內容,互聯(lián)網上并不缺乏這樣的數(shù)據,但這些數(shù)據通常零散分布而無法得到有效的利用。譯庫整合了各種語料資源并進行專業(yè)加工,最終匯聚成一個億級資源的專業(yè)語料庫。
同時,基于語言資產共享這個語言產業(yè)資源的發(fā)展趨勢,譯庫開創(chuàng)了開放式語言大數(shù)據資源共享交換平臺,用戶可以在線使用自己的語言資源提高翻譯效率,也可以上傳、分享自己的語言資產并交換,平臺還提供語言資源的管理、檢索、分享、交換和評價工具。
3.開放式計算機輔助翻譯(CAT)
譯庫的CAT工具不同于單純的人工翻譯或機器翻譯,它是在人機共同參與下完成翻譯的整個項目,方便譯者或學習者在翻譯過程中,減少對文檔本身的工作,更優(yōu)質、高效、輕松地完成翻譯項目。用戶在利用該工具進行在線翻譯和翻譯管理的同時,還可以在線調用開放式語言資產更優(yōu)化翻譯質量。
4.平行文本
譯庫的平行文本把眾多類似的語句搜集起來,主要是為了專業(yè)翻譯人員用于更深入地理解原文和譯文,或為學習者提供參考或學習之用。
在當今資源共享、用戶生成內容為趨勢的互聯(lián)網時代,諸如譯庫這類的語言服務平臺是為了順應翻譯產業(yè)的發(fā)展需要而進行的技術創(chuàng)新。語言服務產業(yè)應在互聯(lián)網技術的推動下,不斷地積極尋求業(yè)務模式和技術技能的突破與創(chuàng)新,更好地滿足客戶的需求,獲得進一步的發(fā)展。