2016年9月GitHub報(bào)告顯示,微軟已在這一全球最大代碼托管網(wǎng)站上擁有16419位開源貢獻(xiàn)者,成為GitHub上排名第一的開源貢獻(xiàn)者。對于這個(gè)全球最大的代碼存放網(wǎng)站和開源社區(qū)而言,微軟的貢獻(xiàn)不僅使Github上又擁有了一大批帥氣美麗聰慧樂于奉獻(xiàn)的程序員(嚴(yán)肅臉),還使得開源界的力量更為壯大。對開發(fā)者個(gè)人而言,更多的開源項(xiàng)目也將幫助他們節(jié)省大量造輪子的時(shí)間,從而專注于性能表現(xiàn)與用戶體驗(yàn)的優(yōu)化。
如何利用好微軟提供的這些開源工具包資源呢?這篇合集介紹了微軟研究院過去兩年的幾個(gè)重要開源項(xiàng)目,如深度學(xué)習(xí)領(lǐng)域的微軟認(rèn)知工具包(原名CNTK)等。大家只需點(diǎn)擊每個(gè)項(xiàng)目后所附的鏈接就可以輕松訪問。
微軟研究院近期開源工具包一覽
1. 微軟認(rèn)知工具包(Microsoft Cognitive Toolkit)
微軟認(rèn)知工具包(原名CNTK) 是微軟出品的開源深度學(xué)習(xí)工具包。新版的微軟認(rèn)知工具包在原有CNTK的基礎(chǔ)上增加了對Python的支持,同時(shí)在性能方面也有所提高。而經(jīng)實(shí)驗(yàn)室測試表明,微軟認(rèn)知工具包的性能在同等主流工具中表現(xiàn)突出。其設(shè)備要求相對靈活,同時(shí)支持CPU和GPU模式。因此沒有GPU,或者神經(jīng)網(wǎng)絡(luò)比較小的實(shí)驗(yàn),可以直接使用CPU版的微軟認(rèn)知工具包。微軟認(rèn)知工具包將神經(jīng)網(wǎng)絡(luò)描述成一個(gè)有向圖的結(jié)構(gòu),葉子節(jié)點(diǎn)代表輸入或者網(wǎng)絡(luò)參數(shù),其他節(jié)點(diǎn)計(jì)算步驟,它同時(shí)支持卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)。
其開源項(xiàng)目主頁是:https://www.microsoft.com/en-us/research/product/cognitive-toolkit/
Github主頁地址為:https://github.com/microsoft/cntk
2. LightGBM
由微軟亞洲研究院DMTK(分布式機(jī)器學(xué)習(xí)工具包)團(tuán)隊(duì)在在GitHub上開源了性能超越其他boosting工具的LightGBM,在三天之內(nèi)GitHub上被star了1000+次,fork了200+次。LightGBM (Light Gradient Boosting Machine)是一個(gè)實(shí)現(xiàn)GBDT算法的框架,支持高效率的并行訓(xùn)練,它的主要優(yōu)勢表現(xiàn)在訓(xùn)練方面的高效性、較低的內(nèi)存占用、更高的準(zhǔn)確率、進(jìn)行并行學(xué)習(xí)與大規(guī)模數(shù)據(jù)處理的能力。公開數(shù)據(jù)表明 LightGBM 相較于同類工具,其學(xué)習(xí)效率和準(zhǔn)確性都表現(xiàn)突出。此外,實(shí)驗(yàn)也表明LightGBM 通過使用多臺機(jī)器進(jìn)行特定設(shè)定的訓(xùn)練能取得線性加速。
LightBGM的開源項(xiàng)目地址參見:https://github.com/Microsoft/LightGBM
關(guān)于LightGBM的更多入門指南,將會在明日的推送中分享給大家哦,了解更多請查看文末的相關(guān)信息。
3.Project Malmo
微軟研究院曾在不久前演示過用游戲《我的世界》來訓(xùn)練人工智能的實(shí)驗(yàn)性項(xiàng)目?,F(xiàn)在這款項(xiàng)目Project Malmo通過GitHub正式開源。研究者可以通過《我的世界》測試人工智能算法,指導(dǎo)人工智能學(xué)習(xí)并完成一些復(fù)雜任務(wù)。這一計(jì)劃可以通過游戲中的人完成現(xiàn)實(shí)生活中的計(jì)劃任務(wù)。當(dāng)微軟研究員團(tuán)隊(duì)在利用這個(gè)工具訓(xùn)練人工智能的角色學(xué)習(xí)如何爬到虛擬世界的最高點(diǎn)時(shí),這些角色使用的是與人類學(xué)習(xí)新任務(wù)時(shí)相同類型的資源。也就是說,這個(gè)由科學(xué)家研究的小人與普通的人類玩家并無區(qū)別,是真正的以人為基礎(chǔ)進(jìn)行的仿真。這樣的仿真使研究者完全不需要開發(fā)人工智能實(shí)體,因此也不再要求研究者有機(jī)器人方面的開發(fā)背景,就可以進(jìn)行一些原來只能靠機(jī)器人或通過極高成本才能進(jìn)行的工作。
項(xiàng)目主頁可打開連接:https://github.com/Microsoft/malmo
4. SDN
分布式服務(wù)器中的多臺服務(wù)器該如何連接?連接之后又該如何確保數(shù)據(jù)傳送效率和實(shí)時(shí)支撐呢? SDN(Software Defined Network)由此應(yīng)運(yùn)而生,它顛覆了傳統(tǒng)網(wǎng)絡(luò)搭建的邏輯,采用虛擬化技術(shù),根據(jù)應(yīng)用數(shù)據(jù)的不同使用方式,動(dòng)態(tài)調(diào)整和分配資源,優(yōu)化數(shù)據(jù)的存貯和轉(zhuǎn)移。據(jù)此,SDN技術(shù)可以為不同的用戶群建立不同的虛擬網(wǎng)絡(luò),實(shí)現(xiàn)不同的資源配置,從而使得物理網(wǎng)絡(luò)的能力被更加合理的利用。微軟現(xiàn)已開發(fā)SDN工具幫助開發(fā)者快速部署起一套SDN平臺。
該項(xiàng)目源碼與具體應(yīng)用方式可打開連接:https://github.com/Microsoft/SDN
5. Sora
微軟亞洲研究院開源的軟件無線電項(xiàng)目Sora是一個(gè)完全可編程的高性能軟件無線電系統(tǒng),能夠快捷而有效地實(shí)現(xiàn)當(dāng)前最前沿的無線通信技術(shù)。軟硬件平臺的創(chuàng)新使Sora在PC上就可以完成高性能的無線信號處理。自2009年首次發(fā)表以來,Sora已在學(xué)術(shù)界獲得多項(xiàng)最佳論文和演示大獎(jiǎng)。目前已有50多家大學(xué)和科研機(jī)構(gòu)在教學(xué)和科研中使用Sora。為滿足研究者們?nèi)找嫫惹械难芯啃枨?,完全開源的Sora系統(tǒng)提供了大量特性,其中包括:支持定制的射頻前端,RCB和通信模式。
Github主頁:https://github.com/Microsoft/Sora
6. GraphView
2015年12月16日,微軟亞洲研究院系統(tǒng)算法組開發(fā)的圖數(shù)據(jù)庫GraphView通過GitHub平臺開源。GraphView是一款中間件軟件,方便用戶使用關(guān)系數(shù)據(jù)庫SQL Server 或Azure SQL Database高效地管理和處理大規(guī)模圖數(shù)據(jù)。GraphView 在物理數(shù)據(jù)表達(dá)以及系統(tǒng)運(yùn)行行為上和原生圖數(shù)據(jù)庫完全一致,填補(bǔ)了關(guān)系數(shù)據(jù)庫和圖數(shù)據(jù)庫之間的鴻溝。它還繼承了關(guān)系數(shù)據(jù)庫領(lǐng)域數(shù)十年的科研成果,可以提供市面上原生圖數(shù)據(jù)庫難以媲美的性能。GraphView的功能包括:完備的查詢語言,索引,事物處理和系統(tǒng)管理等等。
GitHub主頁為:https://github.com/Microsoft/GraphView
項(xiàng)目更多介紹可訪問:http://research.microsoft.com/en-us/projects/graphview/
7. Graph Engine
2015年5月20日,微軟亞洲研究院Graph Engine 1.0預(yù)覽版正式發(fā)布。Graph Engine是一個(gè)基于內(nèi)存的分布式大規(guī)模圖數(shù)據(jù)處理引擎,能夠幫助用戶更方便地構(gòu)建實(shí)時(shí)查詢應(yīng)用和高吞吐量離線分析平臺。Graph Engine在學(xué)術(shù)界有個(gè)更廣為人之的名稱,叫做Trinity。此外,Graph Engine 還可與強(qiáng)大的集成開發(fā)環(huán)境Visual Studio以及微軟云計(jì)算平臺Azure無縫集成。無論本地開發(fā)還是云端部署,Graph Engine都可以給開發(fā)者帶來極佳的用戶體驗(yàn)。
Github主頁源碼:https://github.com/Microsoft/GraphEngine
項(xiàng)目主頁:https://www.graphengine.io/
以上所有開源工具都體現(xiàn)了這樣一種追求:在云時(shí)代與移動(dòng)時(shí)代的大背景下,微軟奉行的“移動(dòng)優(yōu)先、云優(yōu)先”的新愿景使微軟將視野拓展到更為廣闊的范圍。微軟的服務(wù)不僅可以在微軟的軟件或硬件上使用,同時(shí),在各個(gè)平臺,甚至在不同開發(fā)者的應(yīng)用上,微軟的服務(wù)也能為更多用戶帶來更新的技術(shù)和更智能易用的用戶體驗(yàn),這才能真正讓技術(shù)之光照進(jìn)我們?nèi)粘I畹拿恳粋€(gè)角落。畢竟,微軟想做的,是真正的“開發(fā)者之友”。
以下是福利時(shí)間 。
微軟亞洲研究院第三期線上分享正式啟動(dòng)啦!如何看待微軟亞洲研究院新開源的LightGBM?關(guān)于LightGBM你有什么想知道的?請關(guān)注明天的推送。
你也許還想看:
開源|微軟發(fā)布認(rèn)知工具包:讓機(jī)器學(xué)習(xí)更快、更大、更強(qiáng)
開源|分布式機(jī)器學(xué)習(xí)工具包
開源|微軟亞洲研究院開源圖數(shù)據(jù)庫GraphView
為什么我們要讓人工智能玩游戲:微軟project AIX
感謝你關(guān)注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。
微軟小冰進(jìn)駐微軟研究院微信啦!快去主頁和她聊聊天吧。