斯諾登泄密各種美國國安局(NSA)的“黑科技”之后,米國人民似乎意識(shí)到了無論什么樣的通信方式都逃不過來自政府的監(jiān)控,NSA甚至早在40年前就可以識(shí)別語音了。
語音識(shí)別技術(shù)可追溯到20世紀(jì)70年代
要想更好的理解這是怎么一回事,就要追溯到20世紀(jì)70年代:當(dāng)時(shí)美國國防高級研究計(jì)劃局(DARPA)首次出資研究語音識(shí)別技術(shù),在此階段有好幾個(gè)項(xiàng)目都可以將語音轉(zhuǎn)換成文本格式。盡管當(dāng)時(shí)的進(jìn)程很緩慢,但是,通過技術(shù)的不斷提升,識(shí)別的進(jìn)程變得越來越快,獲得的數(shù)據(jù)也越來越多。
DARPA信息創(chuàng)新辦公室主任Dan Kaufman稱:
將語音轉(zhuǎn)換成文本的方法是非常困難的,因?yàn)橥ㄔ捴型鶗?huì)有很多其他的噪音信號(hào)干擾,我們不是很擅長排除這類的干擾,但是我們也正在慢慢的擅長翻譯這些信息。
2001年之后,對間諜工具投入的資本有了顯著的增加,從斯諾登文件中甚至可以發(fā)現(xiàn),十年前NSA分析師對“Google for Voice”的誕生是非常開心的。
然而任何工具都不能做到完美的翻譯語音對話,至少現(xiàn)在還沒有這樣的工具;但是不可否認(rèn)的是當(dāng)前的一些工具著實(shí)很強(qiáng)大,通過大范圍的關(guān)鍵詞搜索、提取語音對話信息、使用算法標(biāo)記對話等方式使得翻譯更加的準(zhǔn)確。
斯諾登文件還指出,美國情報(bào)中心已經(jīng)在一些戰(zhàn)區(qū)(如,伊拉克、阿富汗、拉丁美洲)使用這種工具進(jìn)行監(jiān)聽了,但是他們卻不會(huì)監(jiān)聽美國公民的通話信息。也許全球的公民都應(yīng)該保持警惕了,因?yàn)槊绹閳?bào)機(jī)構(gòu)是使用雷達(dá)進(jìn)行活動(dòng)的,就連美國國會(huì)也覺察不到他們的活動(dòng)。
語音轉(zhuǎn)換工具及其發(fā)展史
2001年爆發(fā)的一次恐怖分子攻擊活動(dòng),攻擊者就是用類似的工具,以自動(dòng)化的方式搜集到了大量的語音通信數(shù)據(jù)。
第一代語音轉(zhuǎn)化工具:RHINEHART
第一代工具叫做“RHINEHART”,首次出現(xiàn)在2004年。NSA一個(gè)叫做For Media Mining, the Future Is Now!的內(nèi)部文件(2006年)中指出:
語音搜索技術(shù)可以幫助分析師快速的查找情報(bào)內(nèi)容,并能根據(jù)情報(bào)內(nèi)容優(yōu)先攔截部分通話。RHINEHART同時(shí)支持實(shí)時(shí)搜索和回顧搜索,這樣一來分析師們即可查到當(dāng)前的通信信息,還可以查到過去的通信信息。
2006年的時(shí)候RHINEHART就能夠在多種語言中進(jìn)行翻譯了。其中西班牙語在轉(zhuǎn)換中的準(zhǔn)確率最高。
第二代語音轉(zhuǎn)化工具:VoiceRT
2009年,VoiceRT開始出現(xiàn),首次用在巴格達(dá)地區(qū),它的目標(biāo)是每天能檢索并標(biāo)記100萬份信息。
第三代語音轉(zhuǎn)化工具:SPIRITFIRE
在2011-2012年間又出現(xiàn)了一個(gè)新工具,叫做“SPIRITFIRE”。它能處理更多的數(shù)據(jù),并且速度更快,在語音-文本的關(guān)鍵字搜索和配對對話轉(zhuǎn)錄功能基礎(chǔ)之上擁有更加穩(wěn)健的語音處理能力。
作為一個(gè)普通的公民,我們希望相關(guān)機(jī)構(gòu)充分尊重我們的權(quán)利,嚴(yán)格管理這類工具,并立法保護(hù)我們的隱私。