人工智能如何實(shí)現(xiàn)從技術(shù)到產(chǎn)品的轉(zhuǎn)化

責(zé)任編輯:zsheng

2018-09-08 13:55:03

摘自:極客網(wǎng)

2014年5月,在微軟Code代碼發(fā)布大會(huì)上,推出了一款名為Skype Translator的同聲傳譯產(chǎn)品。這款產(chǎn)品是Skype(全球免費(fèi)的語音溝通軟件)聯(lián)合微軟的機(jī)器翻譯團(tuán)隊(duì)共同研發(fā)的,其中匯集了機(jī)器翻譯技術(shù)、語言聊天技術(shù)和神經(jīng)網(wǎng)絡(luò)語言識別技術(shù)等,能夠?qū)崿F(xiàn)同聲傳譯。

近年來,人工智能領(lǐng)域出現(xiàn)了很多新應(yīng)用、新產(chǎn)品,例如,借助自然語言處理技術(shù),微軟開發(fā)了一款同聲傳譯軟件——Skype Translator(實(shí)時(shí)語音翻譯技術(shù));借助計(jì)算機(jī)視覺技術(shù),格靈深瞳開發(fā)了一款能智能識別犯罪的視頻監(jiān)控設(shè)備,F(xiàn)ace++開發(fā)了人臉識別云服務(wù);借助于知識表示、規(guī)劃和決策技術(shù),反恐秘密武器和認(rèn)知能力多面手IBM Watson被研發(fā)了出來。

微軟的Skype Translator同聲傳譯產(chǎn)品

2014年5月,在微軟Code代碼發(fā)布大會(huì)上,推出了一款名為Skype Translator的同聲傳譯產(chǎn)品。這款產(chǎn)品是Skype(全球免費(fèi)的語音溝通軟件)聯(lián)合微軟的機(jī)器翻譯團(tuán)隊(duì)共同研發(fā)的,其中匯集了機(jī)器翻譯技術(shù)、語言聊天技術(shù)和神經(jīng)網(wǎng)絡(luò)語言識別技術(shù)等,能夠?qū)崿F(xiàn)同聲傳譯。

在Code大會(huì)上,相關(guān)人員對這款軟件進(jìn)行了測試,讓兩個(gè)不同語種的人借助Skype Translator面對面進(jìn)行交流,結(jié)果二人的交流非常順暢。借助于Skype Translator,當(dāng)一人說出一句話時(shí),系統(tǒng)就會(huì)開始進(jìn)行翻譯,翻譯結(jié)果會(huì)傳達(dá)到另一個(gè)人的耳中,并以字幕的形式在屏幕上顯示出來。借助于這款產(chǎn)品,不同語言、不同口音都能被識別出來,為國際交流提供了極大的便利。

現(xiàn)如今,Skype Translator的開發(fā)還處于早期。未來,隨著Skype Translator研發(fā)的日益深入,世界的交流方式將得以改變。

格靈深瞳的智能視頻監(jiān)控系統(tǒng)

如今,攝像頭在監(jiān)控周邊環(huán)境安全方面發(fā)揮了巨大的作用,但是普通的攝像頭監(jiān)控有兩方面缺陷。

一方面,普通的攝像頭監(jiān)控只能記錄,不能自動(dòng)識別,且監(jiān)控范圍、監(jiān)控場景都有限。例如,要完完全全地監(jiān)控一個(gè)機(jī)場,就要安裝幾萬臺攝像頭,另外還需專門安排幾個(gè)工作人員負(fù)責(zé)監(jiān)控視頻。并且,由于監(jiān)控畫面采用輪播機(jī)制,視頻監(jiān)控畫面會(huì)按一定的時(shí)間周期自動(dòng)切換,使得很多信息被忽略,難以達(dá)到有效監(jiān)控的目的。

另一方面,查詢歷史監(jiān)控記錄很困難。監(jiān)控視頻記錄要消耗的硬盤資源非常大,據(jù)測算,目前,全球監(jiān)控視頻的存儲已經(jīng)占據(jù)了3/4的硬盤資源。舉個(gè)更為形象的例子,某廣場每天的監(jiān)控視頻記錄,如果刻錄在硬盤中,這些硬盤疊加起來的高度甚至能超過埃菲爾鐵塔。面對如此龐大的視頻數(shù)據(jù),要想依靠人眼搜尋某個(gè)畫面或者某個(gè)人,不僅要耗費(fèi)大量的人力資源,還要消耗大量的時(shí)間,效率極低,效果也不佳。

為了解決這個(gè)問題,格靈深瞳,一家于2013年成立的致力于計(jì)算機(jī)視覺開發(fā)的人工智能公司,研發(fā)出了智能視頻監(jiān)控系統(tǒng)。

格靈深瞳對三維視覺感知技術(shù)進(jìn)行了深入研究,使智能視頻監(jiān)控系統(tǒng)能對人、物進(jìn)行精確的檢測與跟蹤,能對人的動(dòng)作姿態(tài)和運(yùn)動(dòng)軌跡進(jìn)行精確的檢測和分析,其中動(dòng)作姿態(tài)包括暴力、跌倒等,人物運(yùn)動(dòng)軌跡包括逆行、徘徊等。如果發(fā)現(xiàn)異常,系統(tǒng)就會(huì)自動(dòng)發(fā)出報(bào)警信號提醒安保人員,保證安保人員能夠及時(shí)發(fā)現(xiàn)異常,這就解決了普通監(jiān)控容易漏掉信息的問題。同時(shí),智能視頻監(jiān)控系統(tǒng)還能借助三維視覺感知技術(shù)將人物特征抽離出來,對其進(jìn)行跟蹤、檢測和搜索,為畫面、人物查詢提供極大的方便。

目前,格靈深瞳的智能視頻監(jiān)控系統(tǒng)已經(jīng)在銀行進(jìn)行了測試。未來,如果該系統(tǒng)能在各領(lǐng)域得到廣泛應(yīng)用,將會(huì)有效地改善現(xiàn)存的各種安全問題。

Face++的人臉識別云服務(wù)

Face++是一個(gè)為用戶提供人臉識別云服務(wù)的平臺。開發(fā)者借助于該平臺提供的開放的人臉識別云服務(wù),能將面部識別功能引入自己的產(chǎn)品。

產(chǎn)品的研發(fā)人員借助Face++提供的離線引擎和API(應(yīng)用程序接口)接入就能享受到免費(fèi)的人臉檢測、人臉分析及人臉識別服務(wù)。首先,借助于人臉檢測服務(wù),用戶能從眾多的圖片中快速地搜尋到目標(biāo)圖片;其次,借助于人臉分析服務(wù),用戶能通過人臉提取各種信息并進(jìn)行分析;最后,借助于人臉識別服務(wù),用戶能對給定人臉的相似度進(jìn)行匹配。

Face++的這種人臉檢測、識別、分析技術(shù)用于美圖秀秀等軟件,能對人面部需要美化的部位進(jìn)行精確定位,實(shí)現(xiàn)自動(dòng)美化。當(dāng)然,這種應(yīng)用只是人臉識別云服務(wù)的初級應(yīng)用。在高級應(yīng)用階段,人臉識別云服務(wù)能夠幫助用戶進(jìn)行圖片搜索。例如,借助于人臉識別云服務(wù),婚介所能夠根據(jù)用戶對另一半的描述在其數(shù)據(jù)庫中進(jìn)行搜索,找到相匹配的信息,以滿足客戶需求。而且,F(xiàn)ace++和360搜索簽訂了合作協(xié)議,在360圖片搜索中用戶可以使用人臉識別云服務(wù)來搜尋自己要想的圖片。

另外,在安全領(lǐng)域,借助人臉識別云服務(wù),F(xiàn)ace++推出了一個(gè)“云臉應(yīng)用鎖”的應(yīng)用軟件,只需掃描人臉、設(shè)置備用密碼,就能為需要加密的內(nèi)容提供保護(hù)。在打開這些內(nèi)容的時(shí)候,必須進(jìn)行人臉識別。通過這款應(yīng)用,用戶的很多隱私信息都能得到有效的保護(hù)。

Palantir:CIA(美國中央情報(bào)局)的反恐秘密武器

Palantir是一家大數(shù)據(jù)挖掘分析公司,它將人工智能算法與強(qiáng)大的引擎整合在一起,它能借助引擎對多個(gè)數(shù)據(jù)庫進(jìn)行掃描,借助人工智能算法對數(shù)據(jù)庫信息進(jìn)行處理,并允許用戶對相關(guān)信息進(jìn)行快速瀏覽。目前,其產(chǎn)品已經(jīng)被CIA、FBI(美國聯(lián)邦調(diào)查局)、私人調(diào)查機(jī)構(gòu)等多種機(jī)構(gòu)所使用。

FBI、CIA等機(jī)構(gòu)的數(shù)據(jù)庫非常多,且數(shù)據(jù)庫中的內(nèi)容非常豐富,涵蓋了包括財(cái)務(wù)數(shù)據(jù)、語音資料、DNA樣本、各地地圖在內(nèi)的多種信息。要想將這些數(shù)據(jù)中的信息聯(lián)系到一起,需要消耗巨大的時(shí)間成本和人力成本。并且,即便各個(gè)數(shù)據(jù)庫之間建立了聯(lián)系,不同種類數(shù)據(jù)的開發(fā)應(yīng)用也面臨著較大困難。Palantir所研發(fā)的產(chǎn)品就很好地解決了這些問題,將數(shù)據(jù)庫的開發(fā)應(yīng)用變得更加簡單。除此之外,對于各種安全問題,Palantir也保持著非常高的敏感度。

Palantir公司這種對數(shù)據(jù)庫的梳理、整合能力,在計(jì)算機(jī)時(shí)代引發(fā)了一場革命。現(xiàn)如今,Palantir公司開發(fā)的產(chǎn)品成為美國情報(bào)機(jī)關(guān)反恐的必備工具。在“9.11事件”發(fā)生之后,Palantir幫助情報(bào)人員解決了很多技術(shù)難題——從大量的數(shù)據(jù)中迅速篩選出有用的線索,為反恐工作提供了有力的支持。

目前,除了安全、反恐,Palantir的業(yè)務(wù)范圍也開始向醫(yī)療、生物科技、零售、保險(xiǎn)等領(lǐng)域滲透,例如,利用Palantir偵破醫(yī)療保險(xiǎn)詐騙案等。在美國,Palantir公司深受歡迎,其年收入早已超過了10億美元,且仍在以每年3倍的速度增長,可謂是人工智能領(lǐng)域的楷模。

IBM Watson:認(rèn)知能力強(qiáng)勁的多面手

Watson是一個(gè)龐大的計(jì)算機(jī)系統(tǒng),IBM服務(wù)器的數(shù)量為90臺,計(jì)算機(jī)芯片有360個(gè),Power 7系列處理器(目前RISC架構(gòu)中功能最強(qiáng)大的處理器)有2880個(gè),其體積相當(dāng)于10臺普通冰箱。這個(gè)龐大的計(jì)算機(jī)系統(tǒng),其內(nèi)存容量達(dá)15TB,運(yùn)算速度達(dá)80萬億次每秒。

Watson是IBM公司在深度開放域問答系統(tǒng)工程(DeepQA)技術(shù)基礎(chǔ)上開發(fā)的一個(gè)計(jì)算機(jī)系統(tǒng)。借助于DeepQA技術(shù),Watson能讀取百萬級的頁面文本數(shù)據(jù),能借助深度自然語言處理技術(shù)針對某一問題給出備選答案,能對問題進(jìn)行有效評估。其系統(tǒng)內(nèi)部預(yù)先設(shè)置的100多套算法能在3秒之內(nèi)給出問題的答案,它能針對某個(gè)問題對海量信息進(jìn)行檢索、篩選,并能將其答案以人類語言輸出。

為了使Watson實(shí)現(xiàn)這些功能,其系統(tǒng)中存儲著海量的圖書、劇本、新聞、文選等資料。在對題目進(jìn)行讀取之后,Watson就會(huì)自動(dòng)對其資料進(jìn)行檢索,在3秒之內(nèi)給出答案。

2006年,IBM公司開始致力于Watson系統(tǒng)的研發(fā);2011年2月,Watson系統(tǒng)在危險(xiǎn)地帶智力搶答游戲中一戰(zhàn)成名;2011年8月,Watson系統(tǒng)被引入醫(yī)療領(lǐng)域。在醫(yī)療腫瘤學(xué)領(lǐng)域,Watson收錄了眾多文本資料,如42種關(guān)于腫瘤學(xué)的醫(yī)學(xué)期刊、60多萬條臨床試驗(yàn)的醫(yī)療數(shù)據(jù)、200多萬頁的文本資料等。在癌癥治療領(lǐng)域,Watson能夠在幾秒內(nèi)完成對150多萬份患者記錄的篩選,其內(nèi)容包括患者病歷、治療方案和治療結(jié)果等,為癌癥治療提供有效的治療方案。目前,全球癌癥治療效果排名前三的醫(yī)院都在使用Watson系統(tǒng)。

2012年3月,Watson系統(tǒng)被引入金融領(lǐng)域,花旗集團(tuán)是第一位客戶。Watson幫助花旗對其用戶需求進(jìn)行分析,對金融、經(jīng)濟(jì)和用戶數(shù)據(jù)進(jìn)行處理,并幫助其構(gòu)建了極具個(gè)性的數(shù)字銀行,還幫助其搜尋可能發(fā)生的金融風(fēng)險(xiǎn)、可能產(chǎn)生的收益以及可能存在的客戶需求。

目前,無論是醫(yī)療信息、金融信息還是其他的信息都在飛速增長,都為Watson系統(tǒng)的開發(fā)應(yīng)用提供了絕佳的商機(jī)。

總之,隨著技術(shù)的突破性進(jìn)展,隨著各IT巨頭在人工智能領(lǐng)域投入的不斷增加,人工智能正在快速發(fā)展,正在以某些領(lǐng)域?yàn)榍腥朦c(diǎn)改變著世界,推動(dòng)世界朝著更好的方向發(fā)展。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號