人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

責(zé)任編輯:zsheng

2018-08-04 08:08:02

摘自:腦極體

據(jù)最新的一項(xiàng)調(diào)查,世界人民三觀并不一定相同,但在識(shí)別“假笑”這件事兒上卻基本上都能做到。不管身處哪個(gè)國家,人們基本上都能更好地分辨出笑聲到底是真的還是假的。

據(jù)最新的一項(xiàng)調(diào)查,世界人民三觀并不一定相同,但在識(shí)別“假笑”這件事兒上卻基本上都能做到。不管身處哪個(gè)國家,人們基本上都能更好地分辨出笑聲到底是真的還是假的。

這是因?yàn)樽匀恍θ莸募∪?、聲音和硬擠出來的笑容肌肉、聲音是截然不同的,比如緊繃度和流暢度。打個(gè)比方,你很容易看出來“假笑男孩”是在“假笑”。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

那么,既然人能識(shí)別“假笑”,那機(jī)器能不能做到?或者說,以目前的技術(shù)發(fā)展水平來說,人工智能是否可以通過識(shí)別技術(shù)來對(duì)人進(jìn)行情緒識(shí)別進(jìn)而做出相應(yīng)的反應(yīng)呢?

我們知道,目前人工智能最成熟的應(yīng)用之一就是圖像和語音識(shí)別,其已經(jīng)廣泛應(yīng)用到拍照識(shí)物、畫面增強(qiáng)、人機(jī)交互等各種領(lǐng)域。但顯而易見的是,目前其很大程度上還是處于識(shí)別和歸類的層面,想要透過表層的識(shí)別去進(jìn)行深層的情緒認(rèn)識(shí)和理解,進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn),尚需時(shí)日。

但這并不代人們對(duì)人工智情緒識(shí)別的望塵莫及。作為對(duì)人的表層識(shí)別的深層次延伸,情緒識(shí)別帶來的變化將是非常積極的。那么,如今的人工智能情緒識(shí)別到底發(fā)展怎樣?它離進(jìn)入我們的現(xiàn)實(shí)生活,到底還有多遠(yuǎn)?

情緒大都一樣,手法各有不同

我們知道,人的情緒體現(xiàn)是多方面的。表情、語言、動(dòng)作等,都可以作為人類表達(dá)情緒的載體。不同的情緒會(huì)以不同的形式體現(xiàn)出來,比如一個(gè)人開心的話就會(huì)笑,嘴巴兩邊向上翹起,眼角也會(huì)微翹;如果特別開心的話,會(huì)“哈哈”大笑。那么,很多研究者就抓住各種情緒對(duì)應(yīng)的表情或動(dòng)作,來對(duì)機(jī)器進(jìn)行訓(xùn)練和學(xué)習(xí)。

可以說,凡是能反映情緒的地方,都已經(jīng)被研究者們翻遍了。

眼球轉(zhuǎn)動(dòng)分析個(gè)性。民科對(duì)眼球轉(zhuǎn)動(dòng)體現(xiàn)人的心理活動(dòng)早就有過一些總結(jié),比如興奮的時(shí)候兩眼放光,沮喪的時(shí)候兩眼無光,悲傷的時(shí)候瞳孔無神,憤怒的時(shí)候怒目圓睜等等。還有人認(rèn)為眼球向左上方看是說謊,右上方看則是思考。無論科學(xué)與否,其總歸是證明眼球?qū)ε袛嗳说男愿?、情緒是由一定的作用的。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

比如最近由德國斯圖加特大學(xué)、澳大利亞弗林德斯大學(xué)和南澳大利亞大學(xué)的研究人員組成的團(tuán)隊(duì)就開發(fā)出了一種機(jī)器學(xué)習(xí)算法,其通過對(duì)系統(tǒng)進(jìn)行大量的訓(xùn)練,調(diào)查了42位受試者日常生活中的眼球轉(zhuǎn)動(dòng)情況,然后去評(píng)估性格特征。比如該算法可以顯示關(guān)于個(gè)人的交際能力、好奇心等,并且能與識(shí)別出大五人格中的四種。那么,能從總體上來判斷一個(gè)人的性格,某種程度上就縮小了需要識(shí)別的情緒的范圍。

微表情分析。很多情況下,人的情緒并不是大起大落的,所以情緒更多的是從微表情上體現(xiàn)出來,比如動(dòng)動(dòng)嘴角、眨眨眼睛。比如翻眼珠的動(dòng)作可能會(huì)表示不屑一顧。因此,作為與情緒直接相關(guān)的一部分,關(guān)于微表情的研究成為眾多公司競(jìng)相上馬的項(xiàng)目。

最近麻省理工就通過機(jī)器學(xué)習(xí)來捕捉面部表情的細(xì)微變化,從而衡量一個(gè)人的心理感受。通過把18段視頻分解為一幀一幀的圖片,模型可以通過學(xué)習(xí)來獲得相應(yīng)表情背后的情緒。最主要的是,它有別于傳統(tǒng)表情識(shí)別的一刀切,可以根據(jù)需要進(jìn)行重新訓(xùn)練,具有高度的個(gè)體適用性。

語言表現(xiàn)分析。除了觀色之外,判斷人的情緒的另一個(gè)直觀方法就是“察言”。比如說話聲音的高低、打字速度的快慢等等。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

日本軟銀公司的情感機(jī)器人pepper,其搭載的攝像頭讓其具備表情識(shí)別的功能,同時(shí)又可以基于云端的語音識(shí)別來實(shí)現(xiàn)對(duì)人說話的語調(diào)識(shí)別,從而獲取人的說話情緒,來實(shí)現(xiàn)其所標(biāo)榜的“情感機(jī)器人”的功能。同時(shí),IBM開發(fā)的能感知情感的在線客服系統(tǒng),也可以通過學(xué)習(xí)識(shí)別藏在語法、打字速度中的人的情緒,類似的對(duì)話式情感識(shí)別人工智能還有微軟的小冰等。

除此之外,結(jié)合可穿戴設(shè)備來獲取人的脈搏頻率等體征也將有助于情感的獲得。總之,在人臉識(shí)別、語音識(shí)別、傳感器和各種數(shù)據(jù)算法的加持下,人工智能識(shí)別情緒看起來呈現(xiàn)出欣欣向榮的態(tài)勢(shì)。

研究者的“小山頭”,或是情緒識(shí)別“笨笨的”之因

然而,我們從以上的研究現(xiàn)狀當(dāng)中可以看到比較明顯的研究特點(diǎn)。

第一,技術(shù)研究呈現(xiàn)“小山頭”。即很多研究者都在試圖通過自己所擅長(zhǎng)的技術(shù)領(lǐng)域去進(jìn)行解釋和實(shí)驗(yàn),比如有的擅長(zhǎng)圖像識(shí)別,有的擅長(zhǎng)語音識(shí)別,有的則擅長(zhǎng)傳感器數(shù)據(jù)分析等。這些研究者或研究團(tuán)隊(duì)往往擁有自己的技術(shù)優(yōu)勢(shì),但也存在一定的短板。

第二,技術(shù)研究的實(shí)驗(yàn)室限制。雖然三歲小孩兒都會(huì)“看人臉色”,但這對(duì)機(jī)器來說已經(jīng)殊為不易。因此,目前的情緒識(shí)別仍然處于起步階段,很多技術(shù)還存在于實(shí)驗(yàn)室或論文當(dāng)中。而這離走進(jìn)現(xiàn)實(shí),至少要三五個(gè)年頭。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

即便是一些公司研發(fā)出成品應(yīng)用,其也一直飽受詬病,顯得笨笨的。比如pepper常被吐槽總是聽不清人說的話,小冰受到的吐槽更是一言難盡。技術(shù)尚未成熟就推出產(chǎn)品,其用戶粘性自然不值一提。

那么,為什么情緒識(shí)別對(duì)pepper、小冰們來說這么難呢?

正常來說,利用機(jī)器識(shí)別人的表情從而進(jìn)行情緒判斷是非常有想象力的,而且遠(yuǎn)景誘人。因?yàn)榧幢闶侨?,有時(shí)候也很難察覺一些一閃而過的表情,導(dǎo)致無法判斷對(duì)方此時(shí)的心理情緒。但是擁有了成熟圖像識(shí)別和聲音捕捉能力的人工智能,處理這些事情看來應(yīng)該是如砍瓜切菜。

那么,導(dǎo)致人工智能“笨笨的”的現(xiàn)狀,也算是事出有因了。

比如我們上文分析過的一個(gè)原因。各研究團(tuán)隊(duì)或公司往往是利用一種或兩種識(shí)別技術(shù)進(jìn)行情緒判斷,或抓住某個(gè)微表情、某一個(gè)聲音,這顯然是不完善的、片面的。比如“憤怒”和“激勵(lì)”兩種情緒,瘋狂的激勵(lì)往往表現(xiàn)為離奇的憤怒,同樣都是怒目圓睜、吼聲震天,人工智能該如何把這兩種情緒識(shí)別開?

這時(shí)候,單純的表情識(shí)別和聲音識(shí)別就體現(xiàn)出局限性了,其還有必要加入動(dòng)作識(shí)別。比如手是握緊拳頭的加油狀,還是食指指向?qū)Ψ降奶翎厾?。如果再加上語言內(nèi)容識(shí)別等其他因素,形成一個(gè)綜合性因素的判斷,將更有利于情緒的精準(zhǔn)識(shí)別。

也就是說,情緒識(shí)別也就不僅僅是“察言觀色”的事兒,還必須要“觀其行”,對(duì)人進(jìn)行全方位、立體式分析。

此外,情緒識(shí)別還有可能因?yàn)樘摷俚谋硐蠖黾与y度。比如文章開頭提到的假笑。單單是識(shí)別人們的最直觀情緒就已經(jīng)困難重重,如何去破解隱藏在偽裝背后的情緒就顯得更為棘手。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

(非常低落而緩慢地跟小冰說話得到無情回答)

但情緒識(shí)別的難度顯然并非僅僅是我們以上分析的幾點(diǎn)。原因在于,情緒是一種心理行為,其也會(huì)由于個(gè)體的不同而展現(xiàn)出不同的表現(xiàn)形式,比如不同的文化當(dāng)中同一手勢(shì)就代表不同的意思,就像貼面在有的國家是禮節(jié)行為,在有的國家就是流氓行徑。

因此,情緒與心理相關(guān)的復(fù)雜性導(dǎo)致其與人的動(dòng)作、表情并不一定呈必然相關(guān)性。但這并不意味著就沒有研究它的意義,反而讓我們能夠明確:研究情緒識(shí)別并不是一定要令每種情緒都有對(duì)應(yīng)的外在表現(xiàn),而是能夠最大程度地利用人工智能幫助我們理解情緒,從而挖掘更多的可能。

不僅能聊天,還能破個(gè)案?

那么,人工智能情緒識(shí)別能力的提升,究竟可以給我們提供哪些方面的便利之處?

首先,人機(jī)交互的體現(xiàn)更加自然順暢,也將直接扭轉(zhuǎn)人們?nèi)粘?duì)“人工智能”的“人工智障”評(píng)價(jià)。這對(duì)于空巢老人、兒童的陪護(hù)將起到積極的作用。通過對(duì)人的情緒捕捉,它可以為老人兒童提供心理安慰。而在這個(gè)基礎(chǔ)上,利用人工智能進(jìn)行情緒識(shí)別也能更好地幫助解決心理疾病問題,分擔(dān)心理醫(yī)生的精力。尤其是在對(duì)話這塊兒,成熟的人工智能會(huì)在對(duì)話的過程中照顧到患者的情緒,從而慢慢地緩解病情。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

并且,在對(duì)老人的看護(hù)之中,其還可以根據(jù)微表情的識(shí)別來判斷老人是否有老年癡呆的情況,從而能夠及時(shí)作出提醒。比如上文提到的麻省理工開發(fā)的情緒識(shí)別算法,既識(shí)別了情緒,必然對(duì)微表情能夠進(jìn)行熟練而準(zhǔn)確的分析。

其次,情緒識(shí)別能夠幫助提高犯罪審訊的效率。影視劇中經(jīng)常出現(xiàn)的一幕是,嫌犯坐在審訊室若無其事,任憑警察如何審訊,其始終一言不發(fā)。而我們知道,警方在利用掌握的已知證據(jù)“詐”嫌犯的時(shí)候,也是非常想知道嫌犯的心理底線到底還有多遠(yuǎn)。

那么,在審訊室裝個(gè)攝像頭、傳感器,另一邊的技術(shù)室實(shí)時(shí)進(jìn)行對(duì)嫌犯的脈搏、體溫、表情、喉結(jié)蠕動(dòng)等各個(gè)細(xì)節(jié)的分析檢測(cè),更有助于掌握嫌犯的心理變化情況,從而對(duì)審訊進(jìn)程了如指掌。比如宜興市檢察院就和中國政法大學(xué)聯(lián)合建立了微反應(yīng)實(shí)驗(yàn)室,并且通過對(duì)犯罪嫌疑人轉(zhuǎn)瞬即逝的表情的成功捕捉,調(diào)整了審訊的方向,成功引導(dǎo)嫌犯交代事實(shí)。

可以預(yù)見的是,隨著情緒識(shí)別的成熟,這項(xiàng)技術(shù)將很快會(huì)部署到警務(wù)系統(tǒng)當(dāng)中。

最后,微表情將對(duì)涉及安全作業(yè)的情況對(duì)人進(jìn)行實(shí)時(shí)提醒?,F(xiàn)代社會(huì)工作呈現(xiàn)出高強(qiáng)度的態(tài)勢(shì),人們?yōu)榱松鎺缀醵荚谄S诒济?,比如司機(jī)。

疲勞駕駛是造成車禍的主要原因之一,尤其在高速上。往往是一秒鐘的打盹,造成了一輩子的悲劇。如果車輛在出廠的時(shí)候就配置了以情緒識(shí)別為主要構(gòu)成的疲勞駕駛提醒系統(tǒng),在司機(jī)打哈欠、瞇縫眼、乃至“磕頭”的時(shí)候不斷進(jìn)行警報(bào)提醒,并提出休息建議,將可以在一定程度上降低車禍發(fā)生概率。

 

人工智能的情緒識(shí)別離我們還有多遠(yuǎn)?

 

此外,利用情緒識(shí)別來管理和控制情緒也可能會(huì)成為一些情緒易失控者的福音。

總之,盡管情緒識(shí)別目前還很單薄,不足以令其成為粘度很高的日常產(chǎn)品。但可以肯定的是,一旦技術(shù)成熟,其帶來的益處將不僅僅是工業(yè)級(jí)的,更是貼近最廣大的消費(fèi)者。當(dāng)情緒可以被當(dāng)作讀懂自己的鏡子,人們也就可以獲得更多來自他“人”的理解,從而解決更多實(shí)際生活中的難題。

可是,你有沒有想過可能由此而來的另外一個(gè)難題:鑒于深度學(xué)習(xí)的黑箱問題尚未解決,萬一人工智能具備了自主的人類情感怎么辦?

那還能怎么辦?準(zhǔn)備拿起武器戰(zhàn)斗吧……

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)