其實在今天,人工智能已經(jīng)在創(chuàng)造收益了,但主要集中在軟件領域。然而當?shù)搅?030年,在軟件行業(yè)之外,人工智能也將創(chuàng)造巨大收益,尤其是在零售、旅游、交通、汽車、材料、制造等行業(yè)。不過,這樣的預測也可能是炒作。人工智能的黃金法則指出,對于人工智能技術不能太樂觀,也不能過于悲觀。
人工智能、機器學習、深度學習這些熱詞近來被頻繁使用。讓承認人工智能將融于世界的現(xiàn)實期望固然很贊,但了解和揭秘人工智能同樣意義重大。這篇文章將闡述人工智能的所有概念,全面理解人工智能,避免混淆這些概念。
話不多說,讓我們開始吧!
縮小人工智能領域
人工智能是一個猶如銀河系的龐大話題,擁有很多子類,如自然語言處理(NLP)、人工神經(jīng)網(wǎng)絡、計算機視覺、機器學習、深度學習、機器人等等。
人工智能的正式定義如下:“可執(zhí)行通常需要人類智能(如視覺感知、語音識別、決策和語言之間的翻譯)的任務的計算機系統(tǒng)的理論和發(fā)展。”在開始深入研究其他領域之前,人工智能可以縮小到以下兩個更廣泛的領域:
· 狹義人工智能——按照編程執(zhí)行一個或幾個特定任務。例如自動駕駛汽車、下詞預測、自動更正等。這是我們要關注的主要概念。
· 廣義人工智能——執(zhí)行類似人類的活動和任務。通用人工智能是一種可以像人類一樣高效執(zhí)行任何智力任務的智能,在這個領域我們還有很多路要走。
還有另一個詞是超級人工智能或強人工智能,被認為是可以超越人類的人工智能。然而,目前這只是個假設,本文將不對此展開討論,在未來幾年內(nèi)達到這種智能水平還很難。
為了理解人工智能的概念以及人工智能相關的各個方面,可以以宇宙為例做一個簡單的類比。
龐大的銀河系類似于廣闊的AI領域,它包含了數(shù)十億個太陽系,就像AI由眾多子領域組成。太陽系就如同人工智能中的一個子領域,即“機器學習”。地球是太陽系中唯一的宜居星球,可以稱為“深度學習”。為更好地理解這個類比,下面有一個簡單的等式:
人工智能=銀河系;機器學習=太陽系;深度學習=地球
機器學習
機器學習是指程序在沒有被明確編程的情況下,自動學習并提高其效率的能力。即給定一個訓練集,訓練機器學習模型,模型將理解其工作原理。經(jīng)過測試集、驗證集或任何其他看不見的數(shù)據(jù)測試后,模型仍然能夠評估特定的任務。
用一個簡單的例子來解釋,假設有一個包含30000封郵件的數(shù)據(jù)集,其中一些被歸類為垃圾郵件,一些被歸類為非垃圾郵件。機器學習模型將在數(shù)據(jù)集上進行訓練。訓練過程完成后,就可以用訓練數(shù)據(jù)集外的郵件來測試。機器學習模型可以對后面的輸入進行預測,并對輸入的郵件是否為垃圾郵件進行正確分類。
機器學習主要有以下三種類型:
· 監(jiān)督學習——這是用特定標記的數(shù)據(jù)集訓練模型的方法。這些數(shù)據(jù)集可以是二分類或多分類,它們將有標記的數(shù)據(jù),指定正確和不正確的選項或選項的范圍。在監(jiān)督下,即在標記數(shù)據(jù)的幫助下,對模型進行預訓練。
· 無監(jiān)督學習——無監(jiān)督學習是指在未標注的數(shù)據(jù)集上訓練模型。這意味著模型沒有任何先驗信息,它通過將相似的特征和模式分組在一起進行自我訓練,區(qū)分狗和貓就是無監(jiān)督學習的例子。
· 強化學習——強化學習是一種嘗試方法模型。這種模型通過反復失敗來學習。沒有達到預期的結(jié)果時,該模型將重新訓練。這可以應用于像下棋這樣的概念中,在下了幾百萬盤棋后,模型將學會正確的模式和步驟。
數(shù)據(jù)
數(shù)據(jù)可以是任何有用的資源或可用的信息,適用于機器學習或深度學習任務。你想要構(gòu)建的每個模型都有大量的數(shù)據(jù)可用,重要的是,找到完成評估所需的有價值的數(shù)據(jù)。
數(shù)據(jù)集是一個數(shù)據(jù)的集合。對于表格數(shù)據(jù),一個數(shù)據(jù)集對應一個或多個數(shù)據(jù)庫表,表中的每一列代表特定的變量,每一行對應相關數(shù)據(jù)集的給定記錄。
當今,人工智能的普及速度比以往任何時候都要快,這要感謝數(shù)據(jù)在不斷豐富和增加。數(shù)據(jù)越多,機器學習或深度學習模型得到的訓練更好,因為能夠在更大的數(shù)據(jù)集上訓練模型,有助于模型在訓練過程中更好地學習,從而更好地執(zhí)行當前的任務。
數(shù)據(jù)科學是關于數(shù)據(jù)的。這個詞有時可能會被忽視,可它卻是所有項目最寶貴的資源。大數(shù)據(jù)、數(shù)據(jù)科學和數(shù)據(jù)分析的領域正在極大地增長,科技巨頭們正在加大對收集有用數(shù)據(jù)的投入。數(shù)據(jù)收集是在一個既定的系統(tǒng)中收集和測量目標變量信息的過程,然后使人們能夠回答相關問題和評估結(jié)果。
深度學習
深度學習是機器學習的一個子領域,基于人工神經(jīng)網(wǎng)絡的概念來執(zhí)行特定任務。人工神經(jīng)網(wǎng)絡的靈感來源于人腦。然而,理論上深度學習的運轉(zhuǎn)并不像大腦。之所以將其命名為人工神經(jīng)網(wǎng)絡,是因為它們可以完成精確的任務,同時達到理想的精確度,不需要根據(jù)任何特定規(guī)則來編程。
幾十年前,深度學習非常流行,但由于缺乏數(shù)據(jù)和無法進行復雜計算,最終失去了熱度。過去幾年,情況大有改觀。每天都有大量豐富的數(shù)據(jù),大型科技巨頭和跨國公司都在投資這些數(shù)據(jù)。有了強大的圖形處理單元(GPU),計算能力也不再是什么大問題。
深度學習如今非常流行,并且具有超越現(xiàn)代大多數(shù)機器學習算法的巨大潛力。
人工智能是當下發(fā)展最快的領域。據(jù)《財富》統(tǒng)計,在過去4年里,人工智能專家的招聘人數(shù)增長了74%,被認為是當下“最火爆”的工作。經(jīng)驗豐富的人工智能專家的需求量正在以前所未有的速度增長。機器學習、深度學習、計算機視覺、統(tǒng)計學和自然語言處理等人工智能子領域的專家需求和空缺職位每天都在激增。
我們很幸運能處于人工智能崛起的時代。我們周圍到處是人工智能,身邊有很多機會。我非常期待未來的新技術和人工智能的崛起!