Win 10 更新了么?這個周末忙翻了吧!反正“cortana小娜”是忙翻了,不停被“調(diào)戲”的截圖分分鐘被刷上頭條。
Cortana小娜是誰?“她呀,中文名字小娜,英文名字是Cortana?。?”說笑了,Cortana小娜是Windows 10內(nèi)置的數(shù)字化助手,是在云端的智能算法。Cortana的到來可是微軟花了三年的時間,現(xiàn)在只要你更新到Win10 ,在你的電腦上就可以和小娜Say“Hello”啦。接下來,我們不是討論如何使用Cortana小娜的,而是打造同樣的Google Now,Apple Siri語音助理,Android語音辨識等戰(zhàn)略級關鍵技術(shù)——機器學習。不只跨國公司搶先研發(fā),連百度、阿里云等本土企業(yè)也早就開始用了。
對人工智能的熱議一直沒有停歇,其背后主因是以谷歌和Facebook為代表的高新技術(shù)企業(yè)廣泛應用機器學習以及深度學習技術(shù)開始顯現(xiàn)出了良好的效果。特別是在語音識別和圖像識別兩個領域,這幾年的提升非???。谷歌在2014年將語音識別的精準度從2012年的84%提升到98%,而Facebook的人臉識別精度在短短幾年里甚至超過人類肉眼的水平。
與此同時,各大企業(yè)開始了一場搶奪人工智能人才的大戰(zhàn),比如谷歌設立了“谷歌大腦計劃”,并在2014初斥資5億美元收購了人工智能創(chuàng)業(yè)公司DeepMind。國內(nèi)的搜索巨頭百度也不甘示弱,高薪從谷歌挖來了斯坦福大學人工智能專家吳恩達負責“百度大腦計劃”。
人類從最早的結(jié)繩記事開始學習積累知識、傳播信息,后來有了文字,將知識總結(jié)成符號記錄下來。人類在不停探索大腦,希望見多識廣,不知疲憊,永不停歇的記憶住一切,但是知識的積累已經(jīng)不能用文字,甚至不能靠人了。直到有了互聯(lián)網(wǎng)的出現(xiàn),通過系統(tǒng)的觀察,來累積每個用戶的行為習慣,不僅了解用戶本身,還能夠得到不同用戶之間的差異,能夠大規(guī)模的抹平信息鴻溝,減輕人腦的負擔。被系統(tǒng)所理解,并沉淀下智慧,這就是機器學習。
機器學習有下面幾種定義:1996年Langley定義的機器學習是“機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能”。 “機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究”。 “機器學習是用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準。” 一種經(jīng)常引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
機器是人工智能的核心,是使計算機具有智能的根本途徑。通過機器學習技術(shù),應用軟件可以分析海量數(shù)據(jù),建立模型,并獲得更加精確的趨勢預測結(jié)果。推出的機器學習功能,可以很容易嵌入到企業(yè)應用軟件產(chǎn)品中,從而減輕開發(fā)負擔。日本通訊與網(wǎng)絡專家吳劍明博士認為,機器學習的思想并不復雜,它模擬人類在生活中學習成長的過程,從數(shù)據(jù)中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預測。因為機器學習算法中涉及了大量的統(tǒng)計學理論,所以也被稱為統(tǒng)計學習理論。換句話說,換句話說,機器學習的本質(zhì)就是將人的操作/思維過程的輸入與輸出記錄下來,然后統(tǒng)計(又叫做訓練)出一個模型用來對新的數(shù)據(jù)進行預測。
上周的互聯(lián)網(wǎng)+實踐周刊第三期《混合云 VS 公有云 誰是企業(yè)云戰(zhàn)略的核心?》中提到目前亞馬遜、微軟、谷歌、IBM等巨頭在云計算領域的廝殺,而基于機器學習技術(shù)的智能預測,也是他們爭奪的新焦點。
早在2012年,搜索巨頭谷歌就推出了“預測API”服務。另外兩個云計算服務商微軟和IBM,也分別推出了“Azure機器學習”和“沃森分析”(沃森“Watson”是IBM超級計算機項目的名字)的機器學習服務。IBM還于今年第一季度收購了專門提供深度學習技術(shù)的AlchemyAPI,整合到沃森核心平臺,以提高沃森迅速辨識及理解大量數(shù)據(jù)集之間關系的能力。IBM Watson部門資深副總裁 Mike Rhodin指出,IBM 在Watson的核心技術(shù)與云開發(fā)平臺,強化生態(tài),藉著第三方開發(fā)商在Watson平臺開發(fā)新業(yè)務與解決方案。他表示,在這個平臺開發(fā)人員已開發(fā)出7000多項應用。
在機器學習方面亞馬遜明顯落后于其他廠商,不過于四月份云計算業(yè)務部門推出“亞馬遜機器學習”(AmazonMachineLearning)是第一個面向企業(yè)提供趨勢預測的產(chǎn)品。該產(chǎn)品會對軟件開發(fā)者提供智能預測的API(軟件開發(fā)接口),開發(fā)者可以建立新的模型,對于來自亞馬遜云計算各種數(shù)據(jù)庫服務的海量數(shù)據(jù)進行分析。
利用云計算和機器學習的案例舉不勝數(shù),在硅谷的VMware公司,他們讓機器去分析員工何時離職?
《紐約時報》曾評論,微軟、谷歌、亞馬遜最重要的不是誰會成為最大的贏家,而是,亞馬遜拉低了云機器學習的價格和門檻。我們離一個低成本預測的時代更近了,而這里說的預測,不局限于預測購物行為、觀影喜好等等,而是全面滲入整個世界:基因組學,物聯(lián)網(wǎng),大型網(wǎng)絡軟件,企業(yè)決策……
但不可忽略的一個問題就是,機器學習需要不同建模方法,而,互聯(lián)網(wǎng)每時每刻都在產(chǎn)生大量新數(shù)據(jù),要求模型隨之不停更新,這就需要不論人還是機器學習,學習都不能停!
云就像電網(wǎng)集中供電一樣,通過網(wǎng)絡從hub向分支傳輸資源和能力。每個企業(yè)自己進行數(shù)據(jù)存儲、計算、分析,就像自己用發(fā)電機發(fā)電一樣,不會是主流現(xiàn)象。當然,就像電廠故障會帶來巨大的經(jīng)濟損失一樣,隨著云平臺承載了越來越多的任務,安全性和可靠性被擺在了更重要的位置。云服務是否能贏得足夠的信任和認可,除了本身的政府的行動對此有很大影響。去年,AWS獲得CIA6億美金的大單,可以說得到CIA的認可,是對AWS可靠度和影響力的有力背書。而在我國,互聯(lián)網(wǎng)+行動計劃的提出,以及工信部出臺可信云認證,都在試圖為云服務指出一條透明的路。