大數(shù)據(jù)的未來–個(gè)人信息/情報(bào)/認(rèn)知服務(wù)的思考

責(zé)任編輯:editor005

2014-09-15 11:29:20

摘自:36大數(shù)據(jù)

利用隱喻[信念世界中存在的命題集合+新的命題],推導(dǎo)出“懷疑世界”,那么剩下的就是“無知世界”,對于這個(gè)世界,隨著現(xiàn)實(shí)世界的數(shù)字化程度越來越高,互聯(lián)網(wǎng)世界對現(xiàn)實(shí)世界的映射會(huì)越來越完整,“無知世界”會(huì)越來越小。

1.未來大數(shù)據(jù)的一切都都關(guān)于人

…不論述

2.大數(shù)據(jù)收集困難和高風(fēng)險(xiǎn)

現(xiàn)在的大數(shù)據(jù)的來源,都是通過自有平臺(tái)收集用戶數(shù)據(jù)的,對于沒有平臺(tái)的企業(yè)很難有機(jī)制和渠道獲取穩(wěn)定的數(shù)據(jù)來源。

有說通過法律和制度來,規(guī)范關(guān)于人的大數(shù)據(jù)使用,在這之前,唯一可行的方向是,把用戶大數(shù)據(jù)使用,做成服務(wù)的必選功能,要使用服務(wù),必須接受隱私風(fēng)險(xiǎn)。

3.對大數(shù)據(jù)的利用方式

現(xiàn)在的大數(shù)據(jù) 都是由各種數(shù)據(jù)聚合出一類關(guān)于人的結(jié)論 然后拿給企業(yè)使用。

我想大數(shù)據(jù)應(yīng)用還有另一類。

利用網(wǎng)上的大數(shù)據(jù),告訴某類人、甚至某個(gè)人,世界發(fā)生著什么,未來要發(fā)生什么。

4.科幻大片

如果從網(wǎng)上下載一個(gè)專屬的虛擬人物(虛擬機(jī)器人/虛擬助理/終生人工智能伴侶)到手機(jī)。

剛開始這個(gè)角色需要你教導(dǎo)(配置,類似早期的語音識別控制的學(xué)習(xí)階段)才能幫你在互聯(lián)網(wǎng)上你做一些簡單的事情。

隨著你教導(dǎo)的更多更好(對你的習(xí)慣,興趣愛好,思維模式,接收度等信息的收集) 和基于大數(shù)據(jù)的挖掘和分析能力的增加,它的智力越來越高,能做一些更復(fù)雜的任務(wù)(作為入口,代表你在互聯(lián)網(wǎng)活動(dòng))。

直到很多年后,它的智力超過你,它能告訴你,世界發(fā)生著什么,未來要發(fā)生什么,它了解你的年齡,了解的行為習(xí)慣,了解你的經(jīng)濟(jì)能力,了解你缺點(diǎn),時(shí)刻為你服務(wù),擴(kuò)展你的人生,使你的人生不局限于經(jīng)驗(yàn)(網(wǎng)上有),思維(網(wǎng)上有),能更好的生活下去(幫你發(fā)現(xiàn)機(jī)會(huì))。

類似的東西,后來才發(fā)現(xiàn)微軟小冰二代已經(jīng)在著手做了,可能愿景和目的不一樣,但輪廓有了。

5.認(rèn)知需求

我們成長的時(shí)候,家長常常說“你懂點(diǎn)事吧”,但如何“懂事”沒有人能教給我們,也沒有告訴我們?nèi)绾稳プ觯ㄈラ喿x書籍,去體驗(yàn)生活,經(jīng)歷人生);

我們畢業(yè)了,工作了,在社會(huì)上依然遇到,“各種成功學(xué)大師”,“各種領(lǐng)域?qū)<?rdquo;,“各種百家講壇老師”,“各種轉(zhuǎn)世神棍”,大行其道;

這一切都是因?yàn)?,人有認(rèn)知的需求。

6.認(rèn)知培訓(xùn)

基于這個(gè)需求,“認(rèn)知服務(wù)”即使做不到自動(dòng),就算做人工服務(wù),也能在現(xiàn)在的教育市場(學(xué)校,興趣培訓(xùn),英語培訓(xùn),等技能培訓(xùn))殺出一條出路。

7.認(rèn)知模式與三分的認(rèn)知世界

萊考夫(George Lakoff)在 [女人、火和危險(xiǎn)的事物]([Women fire and dangerous things])一書中,認(rèn)為理念化的認(rèn)知模式(idealized cognitive models 簡稱ICMs)是結(jié)構(gòu)復(fù)雜的感知整體,是對世界的整體表征,它的價(jià)值在于對輸入信息進(jìn)行重組。ICMs并不客觀存在的,而是人類實(shí)踐和經(jīng)驗(yàn)的高度概括和總結(jié),并且可以為以后的實(shí)踐提供參考。根據(jù)lakoff的論述,IMCs有四種:命題模式,意向圖式模式,隱喻模式和轉(zhuǎn)喻模式,它們的關(guān)系如下:

 

命題模式是出發(fā)點(diǎn)和歸宿,意象圖式模式是基礎(chǔ),轉(zhuǎn)喻模式和隱喻模式是建立在命題模式和意象圖式模式上的認(rèn)知事物的過程和方式,并且二者相互作用。

任一認(rèn)知主體的認(rèn)知世界整體可以劃分為三個(gè)部分:“信念世界”、“懷疑世界”和“無知世界”。我們用Wb表示信念世界,Wd表示懷疑世界,Wu表示無知世界。Wb、Wd、Wu是三個(gè)命題集合,他們的元素是相應(yīng)的認(rèn)知命題。簡單地說,信念世界是由認(rèn)知主體相信的命題構(gòu)成,這些命題構(gòu)成認(rèn)知主體的信念;懷疑世界里的所有命題是認(rèn)知世界說懷疑的,認(rèn)知主體認(rèn)為這些命題是“假的”或“不可能的”,這些命題可稱為“疑點(diǎn)”;認(rèn)知主體從來沒有“考慮”過的命題構(gòu)成無知世界的內(nèi)容,這些命題(以及它們的負(fù)命題)或者仍沒有進(jìn)入認(rèn)知主體的視野之中,或者雖然進(jìn)入了認(rèn)知主體的視野之中但認(rèn)知主體不知道其意義,此時(shí),認(rèn)知主體對之既不相信又不懷疑,這些命題可稱之為“盲點(diǎn)”。

8.認(rèn)知互聯(lián)網(wǎng)世界進(jìn)而認(rèn)知現(xiàn)實(shí)世界

互聯(lián)網(wǎng)世界一直是互聯(lián)網(wǎng)世界的映射,越來越多的現(xiàn)實(shí)世界事物在互聯(lián)網(wǎng)世界建立了數(shù)字化的映射,大數(shù)據(jù)的未來,就是通過這些大數(shù)據(jù)分析現(xiàn)實(shí)世界發(fā)生了什么,未來要發(fā)生什么,有可能到那時(shí),數(shù)據(jù)獲取能力的不平等將取代資本,腦力,智慧的不平等。

9.包裝的產(chǎn)品—認(rèn)知的世界+個(gè)性數(shù)據(jù)=具有類似主人人格的終生人工智能伴侶

10.通過邏輯推理認(rèn)知世界–亞里士多德的三段論

亞里士多德給出的經(jīng)典的“Barbara”三段論:

如果所有人(M)都是必死的(P),(大前提)
并且所有希臘人(S)都是人(M),(小前提)
那么所有希臘人(S)都是必死的(P)。(結(jié)論)
如,

所有人都是必死的。(普遍原理)
蘇格拉底是人。(特殊陳述)
蘇格拉底是必死的。[把特殊(?。┐鷵Q入一般(大)]

又如,

法律規(guī)定這種行為要負(fù)法律責(zé)任,他/她做出了法律規(guī)定的這種行為,他/她要負(fù)這個(gè)法律責(zé)任”。

從上面可看出,三段論由三個(gè)部分組成:大前提、小前提和結(jié)論,它在邏輯上是從大前提和小前提得出來的。大前提是一般性的原則。小前提是一個(gè)特殊陳述。在邏輯上,結(jié)論是從應(yīng)用大前提于小前提之上得到的。

與之相對的是隱喻,

草(P)會(huì)死(M).
人(S)會(huì)死(M).
人(S)是草(P).

這是另一種形式的三段論,是邏輯謬論:這種形式的三段論是邏輯上無效的,但即使是這種邏輯上無效推理,也是人工智慧的表現(xiàn)。

要取得認(rèn)知互聯(lián)網(wǎng)世界的能力,可以從哲學(xué)獲得理論支持,例如從“三段論”和“三分的認(rèn)知世界”,

我們利用有限個(gè)的”大前提集合[命題集合]“組成”初始的信念世界“,大前提,小前提,對應(yīng)[意象圖式模式] 邏輯推導(dǎo)是“命題模式”,最終的結(jié)果是“命題被認(rèn)為是真的,繼而加入“信念世界”。

利用隱喻[信念世界中存在的命題集合+新的命題],推導(dǎo)出“懷疑世界”,那么剩下的就是“無知世界”,對于這個(gè)世界,隨著現(xiàn)實(shí)世界的數(shù)字化程度越來越高,互聯(lián)網(wǎng)世界對現(xiàn)實(shí)世界的映射會(huì)越來越完整,“無知世界”會(huì)越來越小。

比如,

水果是可以吃的[ 信念世界存在的命題]

蘋果是水果[ 信念世界存在的命題]

蘋果是可以吃的[要認(rèn)知的命題]->[加入信念世界]

蘋果是可以吃的[信念世界存在的命題]

蘋果是紅色的[信念世界存在的命題]

西紅柿是紅色的[隱喻]

西紅柿是可以吃的[要認(rèn)知的命題]->[加入懷疑世界]

11.需要什么機(jī)制和技術(shù)

不需要建立自有資料庫,只需要有結(jié)論和認(rèn)知過程

需要有情報(bào)收集的能力(與各個(gè)情報(bào)來源建立通道,能識別相同情報(bào))

需要有對情報(bào)的認(rèn)知能力(歸類,推到,三個(gè)世界的命題集合)

12.云計(jì)算+大數(shù)據(jù)+數(shù)據(jù)挖掘+認(rèn)知能力+學(xué)習(xí)機(jī)制

需要多久才能成長出為1個(gè)2~3歲兒童的智能,它的極限是那?

13.分詞–詞性標(biāo)注–語言理解–信念世界–邏輯推理–懷疑世界–互聯(lián)網(wǎng)學(xué)習(xí)回饋確認(rèn)機(jī)制-大數(shù)據(jù)級別的認(rèn)知世界(人類記憶)–認(rèn)知能力

只要求認(rèn)知水果這類事物,甚至是 水果中的蘋果這個(gè)事物,需要多久,多深的技術(shù),多大的投入?

14.與搜索引擎技術(shù)的區(qū)別

搜索引擎的目的是進(jìn)行相關(guān)度排序,面對的是一個(gè)整體的互聯(lián)網(wǎng)數(shù)據(jù);認(rèn)知服務(wù)通過互聯(lián)網(wǎng)對現(xiàn)實(shí)世界進(jìn)行認(rèn)知,被認(rèn)知的對象本身就是可以分類的,且數(shù)量是有限的??梢哉f從出發(fā)點(diǎn)上,認(rèn)知服務(wù)比搜索站在更高一個(gè)層次。

15.與百度大腦、谷歌大腦、等人工智能的區(qū)別

傳統(tǒng)的人工智能是,通過“神經(jīng)網(wǎng)絡(luò)”,“機(jī)器學(xué)習(xí)” “深度學(xué)習(xí)”等技術(shù)和理論,實(shí)現(xiàn) 像人類大腦一樣思考,像人類大腦一樣學(xué)習(xí)。

目標(biāo)是,從源頭、原理、數(shù)學(xué)理論上突破,取得徹底的普遍的人工智能大腦,在實(shí)施的過程中不斷把新的發(fā)現(xiàn),新的方法應(yīng)用于它們現(xiàn)有的產(chǎn)品中去,提前為人類服務(wù)(但也許會(huì)像語音識別技術(shù)一樣走入 語義識別這樣的歧途)。

認(rèn)知服務(wù)的目標(biāo)是,收集互聯(lián)網(wǎng)的信息,通過認(rèn)知后,得出現(xiàn)實(shí)世界發(fā)生的什么(首先要解決這個(gè)世界是什么樣的?),認(rèn)知的過程是手段,

在當(dāng)前 人工智能發(fā)展不成熟的階段,該手段可以不完美,認(rèn)知出的結(jié)果,可以是不正確的,偏執(zhí)的,神經(jīng)質(zhì)的,甚至是反人類的,只要有一套認(rèn)知機(jī)制

結(jié)合包裝的產(chǎn)品(游戲、娛樂),現(xiàn)階段還是有市場的(看看微軟小冰的轟動(dòng)和反響),產(chǎn)品占領(lǐng)市場后,可以慢慢的改進(jìn)認(rèn)知手段。

16.認(rèn)知服務(wù)的價(jià)值–技術(shù)價(jià)值,個(gè)人/社會(huì)價(jià)值,商業(yè)/產(chǎn)品價(jià)值

了解技術(shù)深度,廣度,積累技術(shù)壁壘,程序化 認(rèn)知模式,和認(rèn)知過程

擴(kuò)展個(gè)人的生活領(lǐng)域,“無知世界”縮小,程序化 認(rèn)知模式,和認(rèn)知過程中,提高自己的認(rèn)知水平

核心技術(shù),跨界,適合任意包裝產(chǎn)品,作為終生人工伴侶,和人的關(guān)系密切,可以形成收集個(gè)人數(shù)據(jù)并利用的閉環(huán)。

17.虛擬客服產(chǎn)品–低層次的分詞,分類知識庫[特定領(lǐng)域和行業(yè)]

我今天看到一個(gè)廠家做的東西,他們已經(jīng)做了10年,還是在底層打轉(zhuǎn),申請了一些專利,但應(yīng)用也只做到 虛擬客服這個(gè)階段,

它的名字叫做“小i機(jī)器人”,它的解決方案、產(chǎn)品服務(wù),

可以認(rèn)為是具有認(rèn)知服務(wù)的殼,做的是傳統(tǒng)知識庫問答的事,貌似存活得很好,而且獲得了以下6個(gè)專利:

一種實(shí)現(xiàn)網(wǎng)頁自動(dòng)客戶服務(wù)的方法和裝置
一種對分享信息進(jìn)行相應(yīng)操作的方法、裝置和設(shè)備
一種用于進(jìn)行語音識別的方法、裝置和設(shè)備
一種基于人工智能的知識問答快速處理系統(tǒng)
一種客服系統(tǒng)及客服信息推送方法
一種實(shí)現(xiàn)自動(dòng)應(yīng)答的系統(tǒng)及方法

其中第三個(gè)專利,2013年被蘋果申訴無效[因?yàn)镾ir,不過該專利真心沒有價(jià)值,只是把語音識別的一般過程+后端知識數(shù)據(jù)庫結(jié)合一下就是一個(gè)專利,這還有活路嗎],但沒有成功,2014年蘋果把專利局和該公司一起告上法院,一審宣判敗訴,現(xiàn)在等待二審。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號