核心提示語言信息技術(shù)是國家信息化發(fā)展的基石及保障國家信息安全的關(guān)鍵力量,盡早開發(fā)并推廣國產(chǎn)操作系統(tǒng)是目前保障我國信息安全的當(dāng)務(wù)之急。
語言是信息傳播的主要載體,在經(jīng)濟全球化背景下,語言文字信息化對國家安全的影響也日益凸顯。中央國家機關(guān)政府采購中心日前下發(fā)了《關(guān)于進行信息類協(xié)議供貨強制節(jié)能產(chǎn)品補充招標(biāo)的通知》,要求中央機關(guān)采購所有計算機類產(chǎn)品不允許安裝Windows 8操作系統(tǒng),以保護政府部門信息安全。在信息化時代,語言文字信息化是信息安全的基礎(chǔ)。有學(xué)者表示,我國語言信息化技術(shù)發(fā)展緩慢,當(dāng)前語言信息化面臨的安全風(fēng)險堪憂,國人所使用的計算機操作系統(tǒng)等重要軟件,核心技術(shù)均為外國所掌握。武漢大學(xué)中國語情監(jiān)測與研究中心主任趙世舉將其形容為,“這就猶如我們的心臟和大腦被別人所掌控,埋下了很大的安全隱患”。信息化時代應(yīng)如何確保信息安全?本報記者就此采訪了相關(guān)學(xué)者。
語言文字信息化能力關(guān)乎國家安全
信息化催生虛擬空間、大數(shù)據(jù)、云計算等成為時代特征的關(guān)鍵詞。“適應(yīng)信息化時代的語言文字處理能力不僅影響我們的語言生活,而且決定著國家信息化水平與信息安全,制約著國家的"信息紅利"。”北京語言大學(xué)黨委書記李宇明表示。
我國是語言資源大國,擁有包括漢語和少數(shù)民族語言在內(nèi)的100多種語言。趙世舉介紹說,維護海量語言文字信息資源安全,保證其不受侵害、流失,這本身就是一大艱巨任務(wù)。尤其是隨著信息技術(shù)的迅猛發(fā)展,信息資源的巨大潛能不斷得到發(fā)掘,成為各種利益追逐的熱點,更加大了其安全風(fēng)險。
記者在采訪中獲悉,2006年,美國提出了“關(guān)鍵語言”戰(zhàn)略,在這一戰(zhàn)略的指導(dǎo)下,美國國防和情報部門開發(fā)了適用于漢語等的“跨語言情報偵查、提取及摘要系統(tǒng)”。據(jù)有關(guān)媒體報道,在英國,僅切爾騰納姆市的政府信息中心就雇傭了300多名語言分析師,實時監(jiān)測分析有關(guān)國家的重要信息。趙世舉介紹說,美國現(xiàn)在正研發(fā)規(guī)模巨大的語言隱喻庫,力圖利用各種公開語言信息來探究不同文化背景的人的思維模式、心理特征和現(xiàn)實行為,借以獲取語言背后隱藏的秘密。
對此,中國傳媒大學(xué)教授侯敏表示,我國要擺脫種種限制,就必須在信息基礎(chǔ)設(shè)施方面掌握核心技術(shù),做到國家重要、關(guān)鍵信息網(wǎng)絡(luò)的安全可控。其中,語言信息技術(shù)是國家信息化發(fā)展的基石及保障國家信息安全的關(guān)鍵力量,盡早開發(fā)并推廣國產(chǎn)操作系統(tǒng)是目前保障我國信息安全的當(dāng)務(wù)之急。
國家信息化建設(shè)離不開語言學(xué)研究
一系列信息安全危機向我國語言信息化建設(shè)提出迫切任務(wù)。近年來,國家語委、工信部、科技部等相關(guān)部門采取了得力措施。在規(guī)范標(biāo)準(zhǔn)建設(shè)方面,制定了《信息交換用漢字編碼字符集基本集》等100多項信息處理用漢語言文字和少數(shù)民族語言文字規(guī)范標(biāo)準(zhǔn);在語言技術(shù)創(chuàng)新方面,漢字處理技術(shù)的優(yōu)秀應(yīng)用成果不斷涌現(xiàn),并廣泛應(yīng)用于移動設(shè)備、機器翻譯、搜索引擎、自動文摘、文本自動分類以及智能語音等領(lǐng)域;在語言資源建設(shè)方面,建設(shè)了國家語委現(xiàn)代漢語語料庫等一系列語料庫、知識庫以及文化資源庫;在少數(shù)民族語言文字信息化建設(shè)方面也不乏重大成果產(chǎn)生。但有學(xué)者表示,目前語言信息化水平與國家和社會的現(xiàn)實需求還有相當(dāng)大的差距。李宇明認(rèn)為,面對信息安全問題,亟須進一步提升語言信息技術(shù)以及處理各類事務(wù)的國家語言能力。
國家信息化建設(shè)以及信息安全的維護離不開語言學(xué)的研究,語言文字信息化研究向語言研究工作者提出了很多新要求新任務(wù)。侯敏說,過去,語言文字工作者主要研究的是面向人的問題;現(xiàn)在,不僅要考慮人的問題,還要考慮機器的問題。僅僅觀察現(xiàn)實社會中的語言現(xiàn)象、解決現(xiàn)實社會中的語言問題還不夠,還要關(guān)注虛擬空間中存在的語言現(xiàn)象,解決虛擬空間中存在的語言問題。
信息化需要語言研究者提供語言理論和語言知識。趙世舉告訴記者,要解決語言文字信息的高效處理問題,無論是基本理念的確定,還是具體工程設(shè)計和工具研發(fā),都必須按照語言文字的規(guī)律和特點來進行。
杭州師范大學(xué)教授馮志偉多年來致力于自然語言處理技術(shù)的研究。他介紹說,信息檢索、信息抽取、信息過濾、文本數(shù)據(jù)挖掘、語種自動辨認(rèn)、跨語言檢索以及建立自然語言“計算模型”都是與信息安全息息相關(guān)的重要研究領(lǐng)域。
語言信息化研究需“文理兼顧”
語言文字信息化之路,我國尚處在起步階段。有學(xué)者表示,尤其面臨信息安全的挑戰(zhàn),目前形勢不容樂觀,無論在科學(xué)研發(fā)能力還是人才培養(yǎng)方面,都有較長的路要走。
由于網(wǎng)絡(luò)信息安全問題是一個多邊緣的、跨學(xué)科的交叉研究領(lǐng)域,需文理兼顧。馮志偉提出,通過語言學(xué)、數(shù)學(xué)、計算機科學(xué)等多學(xué)科的通力合作,把人類知識與計算機的計算能力有效地結(jié)合起來,為自然語言處理的形式模型提供大量的、豐富的“約束條件”,從而解決信息安全中的各種問題。趙世舉也表示,語言文字信息化建設(shè)迫切需要建立多學(xué)科、多機構(gòu)系統(tǒng)化協(xié)同攻關(guān)機制,加強統(tǒng)籌。
同時,也有學(xué)者提出,目前該領(lǐng)域研究的課題支持也遠遠不夠,更多的是國家社科基金的支持。李宇明建議,由于語言信息化屬于工科與人文學(xué)科交叉領(lǐng)域,國家自然科學(xué)基金項目應(yīng)在語音信息處理、語言工程等相關(guān)課題上,面向國家戰(zhàn)略給予更多引導(dǎo)與規(guī)劃;基于不同領(lǐng)域?qū)<业墓餐芯?,設(shè)置語言文字信息化課題研發(fā)的統(tǒng)一架構(gòu)及課題指導(dǎo)意見,引領(lǐng)更多的學(xué)者和科研團隊加入到相關(guān)課題的研究中來。
侯敏提出,在提高重視程度、加大投入的同時,為避免重復(fù)開發(fā),國家應(yīng)投入資金建設(shè)基礎(chǔ)設(shè)施和平臺(如語料庫、數(shù)據(jù)庫、技術(shù)平臺等),以最大程度實現(xiàn)語言資源共享,最大化地發(fā)揮有限資金的作用。
該研究領(lǐng)域具有學(xué)科交叉性,而人才培養(yǎng)卻受制于學(xué)科鴻溝,跨學(xué)科培養(yǎng)實施困難,導(dǎo)致文理兼通的語言信息處理人才缺乏。侯敏建議,學(xué)界應(yīng)對交叉學(xué)科傾斜,大力發(fā)展應(yīng)用語言學(xué),特別是與語言信息化關(guān)系最為密切的計算語言學(xué),盡快培養(yǎng)適應(yīng)信息化的復(fù)合型語言研究人才。