AI熱潮中,有關(guān)神經(jīng)網(wǎng)絡(luò)的聲音最大。然而,AI遠(yuǎn)遠(yuǎn)不止如此。
目前在AI技術(shù)領(lǐng)域中,投入資金最多的當(dāng)屬對(duì)神經(jīng)網(wǎng)絡(luò)的研究了。在眾人眼中,神經(jīng)網(wǎng)絡(luò)技術(shù)貌似就是“程序構(gòu)造的大腦”(雖然比喻很不準(zhǔn)確)。
神經(jīng)網(wǎng)絡(luò)的概念早在20世紀(jì)40年代就被提出,但直到現(xiàn)在,人們對(duì)于神經(jīng)元及大腦的工作方式仍然知之甚少,最近幾年,科研界關(guān)于神經(jīng)網(wǎng)絡(luò)技術(shù)創(chuàng)新的呼聲越來越強(qiáng),渴望重啟神經(jīng)網(wǎng)絡(luò)的熱潮……
其實(shí),除了神經(jīng)網(wǎng)絡(luò)以外,AI領(lǐng)域中還包含很多更有趣、更新穎,更有前景的技術(shù),文章中就將這些技術(shù)介紹給大家。
1. Knol提取
Knol指信息單元,也就是關(guān)鍵字、詞等,Knol提取技術(shù)則是從文本中提取關(guān)鍵信息的過程。舉個(gè)簡單的例子:比如“顧名思義,章魚有8條腿”這句話經(jīng)過提取后,就變成了這個(gè)樣子:{“章魚”:{“腿的數(shù)目”:8}}。
我們常用的Google搜索引擎就依賴于這項(xiàng)技術(shù),后續(xù)介紹的技術(shù)中,很多也都包含了這項(xiàng)技術(shù)。
2. 本體構(gòu)建
本體構(gòu)建是基于NLP的技術(shù),旨在用軟件來構(gòu)建實(shí)體名詞的層次結(jié)構(gòu),這一技術(shù)對(duì)實(shí)現(xiàn)AI會(huì)話大有幫助。雖然本體構(gòu)建表面看起來簡單,但事實(shí)上構(gòu)建卻并不容易,主要因?yàn)槭挛镏g的實(shí)際聯(lián)系比我們所認(rèn)為的要復(fù)雜的多。
例如,利用NLP分析文本來建立實(shí)體關(guān)系集:
例句:“我的拉布拉多犬剛剛生了一群小狗崽,它們的父親是只獅子狗,所以它們是拉布拉多貴賓犬(一種混血犬)”這句話被轉(zhuǎn)換后,就變成了:{“小狗崽”:{“可能是”:“拉布拉多貴賓犬”,“擁有/生(have)”:“父親”},“拉布拉多犬”:{“擁有/生(have)”:“小狗崽”}}。
但是,人類在進(jìn)行語言表達(dá)時(shí),通常不會(huì)將所有的關(guān)系都陳述出來,比如這句話中,是要通過推斷才能得出“我的拉布拉多犬為雌性”這一事實(shí),這就是本體構(gòu)建的難點(diǎn)所在。
正如此,本體構(gòu)建技術(shù)目前只應(yīng)用在了頂尖的聊天機(jī)器人中。
3. 自定義啟發(fā)式
啟發(fā)式是一種用于分類的規(guī)則,通常類似于“如果這件物品是紅色的”或“如果Bob在家里”這樣的條件語句,這些條件語句常伴隨某項(xiàng)動(dòng)作或決定,例如:
如果某物[“成分”]屬性中包含“砷”這一元素:則它的[“毒藥”]屬性為“True”。
對(duì)于每個(gè)新的信息,都伴隨著新的啟發(fā)式和新的關(guān)系,隨著新的啟發(fā)式的建立,又可以對(duì)相關(guān)的名詞產(chǎn)生新的理解。比如:
啟發(fā)式一:"puppies"(小狗)說明是幼崽(Babies);
啟發(fā)式二:幼崽(Babies)說明很年輕;
通過以上兩個(gè)啟發(fā)式推斷出:"puppies"都很年輕。
啟發(fā)式的難點(diǎn)在于,多數(shù)情況下,規(guī)則并不會(huì)如“If/Then”一樣簡單。類似于“有些人頭發(fā)是金色的”這樣的語句,就很難用啟發(fā)式來表述。所以我們有了“認(rèn)知論”(見下)。
4. 認(rèn)識(shí)論
認(rèn)識(shí)論是本體構(gòu)建和自定義啟發(fā)式的結(jié)合,并在其中加入了概率特性,通過概率表示名詞與任一屬性產(chǎn)生關(guān)聯(lián)的可能。比如,用這樣本體結(jié)構(gòu):
{'人':{'性別':{'男':0.49,'女':0.51},'種族':{'亞裔':0.6,'非洲裔':0.14}}
來表示對(duì)一個(gè)人性別和種族的判斷。同時(shí),概率能幫助識(shí)別一些具有多重含義的“混合型”詞組,比如像“梅子像是打了激素的葡萄干”這句話中,因?yàn)?ldquo;打了激素”這一詞組很大可能地意味著“體積較大”,從而得出,這句話很大可能的意思是“梅子體積比葡萄干大”。
認(rèn)識(shí)論的實(shí)現(xiàn)相比本體構(gòu)建要困難得多。首先,它需要更多的數(shù)據(jù);并且,由于其結(jié)構(gòu)的復(fù)雜性,很難在確定規(guī)則后快速地建立起數(shù)據(jù)庫來實(shí)現(xiàn)查找;還有,規(guī)則的確定通?;谀稠?xiàng)事物在一段文字中被提及的頻率,但文字卻未必能真實(shí)地反映現(xiàn)實(shí)情況。
認(rèn)識(shí)論與Asimov提出的“張量流”理論很相似。Google開發(fā)的同名TensorFlow系統(tǒng)并不是真正基于張量,而認(rèn)識(shí)論是基于張量的。
5. 自動(dòng)量規(guī)技術(shù)
一個(gè)量規(guī)系統(tǒng),必定包含相應(yīng)的評(píng)估標(biāo)準(zhǔn)。想象一下,在選購房子時(shí),有房屋面積,位置,價(jià)格和風(fēng)格等因素需要考量,而這些因素未必都是積極的,這就需要有通過衡量取舍來決策。比如,相比價(jià)格你更在乎房屋面積,就會(huì)寧愿多花幾倍的錢來購買大房子。
自評(píng)估技術(shù)通過你對(duì)不同因素的重視程度來確定每項(xiàng)因素的權(quán)重,從而提出決策建議。通過這一過程,還可以預(yù)測庫存變化,推薦產(chǎn)品,實(shí)現(xiàn)自動(dòng)駕駛等。也就是說,大多數(shù)神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)的功能,自動(dòng)量規(guī)技術(shù)都能勝任,盡管需要更長的訓(xùn)練時(shí)間,但卻有著快幾個(gè)數(shù)量級(jí)的決策速度。
6. 矢量差分
矢量差分技術(shù)常用于圖像分析,也可用于時(shí)變數(shù)據(jù)的處理。通過對(duì)目標(biāo)構(gòu)建抽象矢量圖,將候選對(duì)象與待識(shí)別目標(biāo)對(duì)象進(jìn)行比較,從而判斷出是否為“最佳的約會(huì)臉型”或“最佳的買入時(shí)機(jī)”等。
通常,目標(biāo)對(duì)象之間差異都伴隨一個(gè)衡量差異程度的量化規(guī)則,通過特征的矢量化,將一些“模糊”的概念,簡單、清晰的表示出來。
比如,對(duì)于人類來講,我們籠統(tǒng)地認(rèn)為對(duì)稱的臉型更具有吸引力,但是對(duì)于計(jì)算機(jī),就需要精確的計(jì)算來判斷,而這時(shí),通過30個(gè)三角形來進(jìn)行臉部抽象,比通過完整臉部圖像來進(jìn)行運(yùn)算對(duì)比,能節(jié)省很多的計(jì)算時(shí)間和存儲(chǔ)空間。
對(duì)于非圖像的數(shù)據(jù)的處理也是可以的。比如股票價(jià)格變動(dòng)、每股收益與保證金的比率等,通過對(duì)這些數(shù)據(jù)矢量化,將其與理想值進(jìn)行比較,就可以確定一次投資的利好或風(fēng)險(xiǎn)程度。
7. 矩陣卷積
卷積矩陣常用于圖像處理領(lǐng)域中的邊緣檢測和提高對(duì)比度等方面,例如,PhotoShop中的許多濾鏡都是基于卷積矩陣或疊加卷積(按特定順序進(jìn)行多個(gè)卷積運(yùn)算)實(shí)現(xiàn)的。
同時(shí),卷積矩陣還可用于處理非圖像數(shù)據(jù)。比如,當(dāng)使用卷積矩陣對(duì)時(shí)序向量進(jìn)行處理時(shí),可以像邊緣檢測那樣,快速地找出模式來,再在最小或最大值處查找特定值或范圍,從而做出判斷。
8. 多視角決策系統(tǒng)
一項(xiàng)決定的做出并不簡單。多視角決策系統(tǒng)以一種更民主的形式,多方面地作出決定。
比如,在剛剛房子的例子中,你對(duì)于某套房子的看好可能基于并不全面的因素,而之后的一個(gè)“這套房子建在懸崖上”的事實(shí)(當(dāng)然,這種壓倒性因素可能來自于Knol提取)就會(huì)消除你先前的所有好感,讓你重新決策。
所以,決策需要通過更全面的因素考量,而多視角決策系統(tǒng),可以利用兩個(gè)人的兩套標(biāo)準(zhǔn)(比如你和你的配偶)來衡量決策。多視角決策系統(tǒng)還可應(yīng)用于自動(dòng)駕駛領(lǐng)域,比如,收集10000個(gè)車主的看法來制定新標(biāo)準(zhǔn)等。
寫在最后——要相信技多不壓身
許多人眼中只有一把工具,掉進(jìn)“我有的就是一把錘子,所以一切都是釘子”的深坑。諸如Recognant這樣的公司,在應(yīng)用神經(jīng)網(wǎng)絡(luò)的同時(shí),也同樣在應(yīng)用文章中這些相對(duì)冷門的技術(shù),畢竟相比于神經(jīng)網(wǎng)絡(luò)硬件系統(tǒng),
這些軟件技術(shù)的優(yōu)勢就在于,能針對(duì)不同情況進(jìn)行隨時(shí)的調(diào)整和開發(fā),而無需花費(fèi)額外的成本。所以,技術(shù)面窄,就有可能被一些情況所困住,而技術(shù)面越寬,面對(duì)問題就越容易迎刃而解。