IBM新型導(dǎo)航APP:幫助盲人像正常人一樣漫步

責(zé)任編輯:editor004

作者:自坤

2015-11-17 11:00:02

摘自:新浪科技

它可以將盲人的周邊環(huán)境處理成3D空間模型,并通過超聲波提供更準(zhǔn)確的定位和導(dǎo)航制導(dǎo);為了讓盲人知道身邊都有誰,這個應(yīng)用還貼心地提供了人臉掃描功能,并能告訴盲人身邊的人的情緒。

IBM,這個藍(lán)色巨人近年來在科技領(lǐng)域似乎過于保守。從生產(chǎn)機(jī)械制表機(jī)開始,直到成為一個集硬件、軟件和服務(wù)于一身的大型科技企業(yè),IBM在自己的領(lǐng)域顯得非常專注,并不輕易進(jìn)行核心領(lǐng)域之外的其他科研活動。它曾經(jīng)在存儲技術(shù)、數(shù)字通信技術(shù)、半導(dǎo)體芯片技術(shù)等方面領(lǐng)先世界,但是也僅僅是淺嘗輒止,并沒有深耕細(xì)作,形成完整的產(chǎn)業(yè)鏈。它更多地是不斷完善自己的系統(tǒng),以服務(wù)于政府單位、金融機(jī)構(gòu)和大企業(yè),似乎對個人零售產(chǎn)品不太感興趣。

即便到了移動互聯(lián)網(wǎng)時代,也不見得它在個人版APP上的開發(fā)有多大的突破。雖然在去年和蘋果公司合作開發(fā)了10款I(lǐng)OS系統(tǒng)的APP,涉及航空、金融、保險(xiǎn)、電信、零售以及政府通信等領(lǐng)域,但是這些APP無一例外全部是企業(yè)版本。比如一款叫做Plan Flight的APP,主要用途是供飛行員提前查看航班時刻表、航班計(jì)劃以及機(jī)組人員名單,在飛行中向地勤人員報(bào)告遇到的問題,提出最佳燃油使用推薦,很顯然這個APP是為航空公司設(shè)計(jì)的。

服務(wù)大企業(yè)和大機(jī)構(gòu)是IBM的一貫作風(fēng),也是這家企業(yè)傳承已久的商業(yè)傳統(tǒng)和文化基因。二戰(zhàn)時期,它甚至還制造過槍械武器,當(dāng)時下訂單的是美國國防部。

這是一個足以傲視全球的巨無霸,但是最近它悄悄改變了作風(fēng),開始研發(fā)一款個人用的APP,說實(shí)話,這個APP還不一定有多少人用,但是這個轉(zhuǎn)變無疑是值得期待的。

IBM和卡內(nèi)基·梅隆大學(xué)合作開發(fā)個人用APP

華盛頓郵報(bào)近期在科技欄目上刊發(fā)了一篇短文,介紹了一款可以做盲人眼睛的新型APP,那么這個被叫做NavCog的應(yīng)用到底如何呢?下面先簡單介紹一下。

1、由IBM和卡內(nèi)基·梅隆大學(xué)合作開發(fā)。負(fù)責(zé)這個手機(jī)應(yīng)用開發(fā)的工程師來自久負(fù)盛名的IBM Research和卡內(nèi)基-梅隆大學(xué),這個開發(fā)工程是雙方的合作項(xiàng)目。有意思的是,其中一個主要的工程師,名叫Asakawa的女士,她自己本身就是一個盲人,她對這個應(yīng)用充滿期待和自信,她希望以后能夠憑借這個應(yīng)用在科研樓里自由漫步。

2、它不只可以導(dǎo)航。習(xí)慣了手機(jī)地圖的我們,對于導(dǎo)航功能并不陌生,甚至是司空見慣??墒菍τ诿と?,事情就沒有那么簡單了。不過,這個應(yīng)用的構(gòu)想也是不簡單的。

首先,這個應(yīng)用可以通過語音或者震動兩種方式,為盲人提供信息并進(jìn)行導(dǎo)航;

其次,它可以將盲人的周邊環(huán)境處理成3D空間模型,并通過超聲波提供更準(zhǔn)確的定位和導(dǎo)航制導(dǎo);

第三,為了讓盲人知道身邊都有誰,這個應(yīng)用還貼心地提供了人臉掃描功能,并能告訴盲人身邊的人的情緒。

當(dāng)然,導(dǎo)航功能目前已經(jīng)成熟,而人臉識別還在探索。

3、它暫時依賴藍(lán)牙燈塔提供的信號。應(yīng)用的運(yùn)行在目前主要依靠藍(lán)牙燈塔(Bluetooth Beacon),藍(lán)牙燈塔在國內(nèi)可能不多見,但是在蘋果、谷歌等企業(yè)已經(jīng)有相關(guān)的產(chǎn)品問世,簡而言之,它是一種比較方便的信號傳遞載體。目前,NavCog的試驗(yàn)主要依賴于遍布校園的藍(lán)牙燈塔,不過根據(jù)工程師們的介紹,他們的工作方向是逐漸讓應(yīng)用適應(yīng)各種環(huán)境,適應(yīng)沒有藍(lán)牙燈塔的環(huán)境。

藍(lán)牙燈塔

  藍(lán)牙燈塔

IBM也許會給人們帶來驚喜

如果NavCog的導(dǎo)航和人臉識別系統(tǒng)完善了,那么它將是盲人的一大福音?;蛟S某一天在街頭上,你可以看見一個身穿休閑裝、戴著耳機(jī)悠閑散步、時不時和路上的熟人打招呼的人,她看起來和我們一模一樣,誰也不會說她是個盲人。

不過IBM的工程師不滿足這些,有了上述功能,工程師可以開發(fā)出其他提高輔助認(rèn)知能力的應(yīng)用,這些應(yīng)用可以當(dāng)做醫(yī)護(hù)人員和氣象監(jiān)測員的助手,甚至它還有可能用到對自閉癥的研究中來。

雖然目前的技術(shù)水平還沒有達(dá)到此程度,但是不得不說這是IBM給人們帶來的驚喜,一個蘊(yùn)含著人文關(guān)懷的手機(jī)應(yīng)用,一份進(jìn)軍個人版APP領(lǐng)域的華麗開端。

一款可以做盲人眼睛的新型APP

本文所提到的華盛頓郵報(bào)文章,我自己將這篇文章翻譯出來了,供參考

隨著計(jì)算機(jī)在周邊環(huán)境下的感知能力的進(jìn)一步提升,它也在幫助人們更好地感知這個世界。好在人工智能和機(jī)器人學(xué)等專業(yè)的發(fā)展,IBM Research和卡內(nèi)基·梅隆大學(xué)的科學(xué)家正在為視覺損傷者研究一項(xiàng)讓他們能夠看見外面的世界的新方法。

這個目標(biāo)不僅鼓舞人心,還極具創(chuàng)意——建立一個技術(shù)平臺,讓視覺損傷者可以向其他人一樣自由漫步。這個工程的第一個嘗試是一款叫做NavCog的應(yīng)用,它可以在IOS系統(tǒng)和安卓系統(tǒng)上使用,這個應(yīng)用可以通過耳機(jī)發(fā)出的聲音或者讓手機(jī)震動來為盲人導(dǎo)航(使用者可以選擇設(shè)定應(yīng)用為“聲音模式”還是“震動模式”)。

就像汽車GPS提供的實(shí)時導(dǎo)航一樣,這個應(yīng)用為盲人提供實(shí)時的視角。它分析來自人行道上的藍(lán)牙燈塔以及智能手機(jī)傳感器提供的信號,能讓盲人在沒有其他人的幫助下自由行動,無論在學(xué)校建筑內(nèi)還是在戶外都可以。

當(dāng)程序能夠幫助盲人隨時定位、告訴他們所處的方向以及周邊環(huán)境的其他信息時,好戲就開始了。電子導(dǎo)航程序?qū)⑹謾C(jī)內(nèi)對周邊環(huán)境拍下的照片處理成3D空間模型,以此來作為實(shí)時導(dǎo)航的指導(dǎo)。

NavCog工程,是位于Yorktown Heights 的IBM Research和卡內(nèi)基-梅隆大學(xué)的合作項(xiàng)目,它對于工程的主要研究者之一的Chieko Asakawa具有特別的意義,她是IBM的院士以及卡內(nèi)基-梅隆的客座教授,她是一個盲人。對她而言,利用這個APP幫助她在校園內(nèi)行走將可能在短時間內(nèi)變?yōu)楝F(xiàn)實(shí),她戴著耳機(jī),聽著從手機(jī)里傳過來的聲音,行走時和別人并非兩樣。

“這僅僅是一個開端”,卡內(nèi)基·梅隆大學(xué)機(jī)器人研究院的Kris Kitani這樣說道。當(dāng)然,一個主要的目標(biāo),是要拓展被藍(lán)牙燈塔覆蓋面,目前的試驗(yàn)主要依靠的是大學(xué)校園里面的藍(lán)牙燈塔。為了鼓勵覆蓋,項(xiàng)目科學(xué)家將NavCog平臺完全開放了,開發(fā)者能夠自由使用IBM BlueMix cloud上的資源。這使得其他的開發(fā)者有能力為系統(tǒng)強(qiáng)化其他方面的功能,并且加快展現(xiàn)出其他物理上的功能。

Kitani說,另一個重要目標(biāo),是使系統(tǒng)可以在任何環(huán)境,甚至在沒有藍(lán)牙燈塔的情況下運(yùn)行。為了將這個可能性變?yōu)楝F(xiàn)實(shí),學(xué)校希望在電子視覺和輔助認(rèn)知兩方面進(jìn)行提升,開展新的工作。輔助認(rèn)知這個領(lǐng)域的設(shè)立是為了增強(qiáng)盲人正在消失和弱化了的感知能力,從外界重新獲得信息。

例如,通過電子輔助視覺系統(tǒng)對照片的處理,可能會發(fā)展一個更加精準(zhǔn)的,不需要藍(lán)牙燈塔的系統(tǒng)。此外,當(dāng)電子輔助視覺系統(tǒng)與定位系統(tǒng)結(jié)合時,潛在地也就能識別出每天的“地標(biāo)”。比如,路上一排臺階或者柵欄,這些東西目前并不能被傳感器感應(yīng)。

“憑借對那些對象的本地化信息的理解,我們正在嘗試一項(xiàng)技術(shù),讓現(xiàn)實(shí)環(huán)境更加適合每一個人。我們開展人類智能和機(jī)器人技術(shù)的研究已經(jīng)有很長一段時間,我們能更好地完善人們對于周邊環(huán)境的感知能力。這個開放的平臺將擴(kuò)大全球研究人員合作范圍,一個視覺障礙患者觀看世界的新時代即將來臨。”

——卡內(nèi)基-梅隆大學(xué)機(jī)器人學(xué)院院長Martial Hebert說。

得利于卡內(nèi)基-梅隆大學(xué)內(nèi)人工智能和機(jī)器人專業(yè)的融合,研究者計(jì)劃在系統(tǒng)內(nèi)加入其他的功能,使得NavCog不僅僅可以導(dǎo)航。舉個例子,面部識別元件將實(shí)時提醒你,你正在一個熟人旁邊路過。不止如此,傳感器還可以識別人們面部表情所反映出來的情緒:因?yàn)樗梢苑治龀鲈谀忝媲按掖叶^的人是笑容滿面還是緊鎖眉頭——這是與學(xué)校里其他關(guān)于自閉癥的部分研究工作有關(guān)。研究者同時還可以探索通過電子視覺來判斷周圍的人的活動,通過超聲波技術(shù)更加精準(zhǔn)的定位。

如Asakawa所說,輔助識別的研究的進(jìn)步創(chuàng)造出的NavCog應(yīng)用與IBM Watson機(jī)構(gòu)展示的電子識別是有類似的地方的。在這兩個案例中,他們都在不斷嘗試在確保時效性的前提下提高人類的識別能力。例如,在IBM公司內(nèi)部,研究者有時候會使用“Watson on my shoulder”這個術(shù)語來憧憬IBM Watson的未來。那將是一個連續(xù)的、地方化的存在,它可以為所有人提供輔助識別,包括醫(yī)護(hù)人員和氣象監(jiān)測員。

如果一切進(jìn)展順利,那么就可以為機(jī)器智能和人類智能設(shè)想一個高質(zhì)的反饋回路,在這里,為提升機(jī)器能力而發(fā)展起來的識別技術(shù),最終也會促進(jìn)人類能力本身的提升。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號