微軟研究院近兩年七大重要開源項目盤點

責(zé)任編輯:editor007

作者:王練

2017-01-07 22:01:46

摘自:微軟研究院AI頭條

微軟研究院近期開源工具包一覽1 微軟認知工具包(Microsoft Cognitive Toolkit)  微軟認知工具包(原名 CNTK ) 是微軟出品的開源深度學(xué)習(xí)工具包。

2016年9月GitHub報告顯示,微軟擁有16419位開源貢獻者,排名第一。微軟的貢獻使得開源界的力量更為壯大。對開發(fā)者個人而言,更多的開源項目也將幫助他們節(jié)省大量造輪子的時間,從而專注于性能表現(xiàn)與用戶體驗的優(yōu)化。

如何利用好微軟提供的這些開源工具包資源呢?這篇合集介紹了微軟研究院過去兩年的幾個重要開源項目,如深度學(xué)習(xí)領(lǐng)域的微軟認知工具包(原名CNTK)等。大家只需點擊每個項目后所附的鏈接就可以輕松訪問。

微軟研究院近期開源工具包一覽1. 微軟認知工具包(Microsoft Cognitive Toolkit)

微軟認知工具包(原名 CNTK ) 是微軟出品的開源深度學(xué)習(xí)工具包。新版的微軟認知工具包在原有 CNTK 的基礎(chǔ)上增加了對 Python 的支持,同時在性能方面也有所提高。而經(jīng)實驗室測試表明,微軟認知工具包的性能在同等主流工具中表現(xiàn)突出。其設(shè)備要求相對靈活,同時支持 CPU 和 GPU 模式。因此沒有 GPU ,或者神經(jīng)網(wǎng)絡(luò)比較小的實驗,可以直接使用 CPU 版的微軟認知工具包。微軟認知工具包將神經(jīng)網(wǎng)絡(luò)描述成一個有向圖的結(jié)構(gòu),葉子節(jié)點代表輸入或者網(wǎng)絡(luò)參數(shù),其他節(jié)點計算步驟,它同時支持卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)。

項目主頁:https://www.microsoft.com/en-us/research/product/cognitive-toolkit/

2. LightGBM

由微軟亞洲研究院DMTK(分布式機器學(xué)習(xí)工具包)團隊在在 GitHub 上開源了性能超越其他 boosting 工具的 LightGBM,在三天之內(nèi) GitHub 上被 star 了1000+次,fork了200+次。LightGBM (Light Gradient Boosting Machine)是一個實現(xiàn) GBDT 算法的框架,支持高效率的并行訓(xùn)練,它的主要優(yōu)勢表現(xiàn)在訓(xùn)練方面的高效性、較低的內(nèi)存占用、更高的準(zhǔn)確率、進行并行學(xué)習(xí)與大規(guī)模數(shù)據(jù)處理的能力。公開數(shù)據(jù)表明 LightGBM 相較于同類工具,其學(xué)習(xí)效率和準(zhǔn)確性都表現(xiàn)突出。此外,實驗也表明 LightGBM 通過使用多臺機器進行特定設(shè)定的訓(xùn)練能取得線性加速。

3.Project Malmo

微軟研究院曾在不久前演示過用游戲《我的世界》來訓(xùn)練人工智能的實驗性項目?,F(xiàn)在這款項目Project Malmo通過 GitHub 正式開源。研究者可以通過《我的世界》測試人工智能算法,指導(dǎo)人工智能學(xué)習(xí)并完成一些復(fù)雜任務(wù)。這一計劃可以通過游戲中的人完成現(xiàn)實生活中的計劃任務(wù)。當(dāng)微軟研究員團隊在利用這個工具訓(xùn)練人工智能的角色學(xué)習(xí)如何爬到虛擬世界的最高點時,這些角色使用的是與人類學(xué)習(xí)新任務(wù)時相同類型的資源。也就是說,這個由科學(xué)家研究的小人與普通的人類玩家并無區(qū)別,是真正的以人為基礎(chǔ)進行的仿真。這樣的仿真使研究者完全不需要開發(fā)人工智能實體,因此也不再要求研究者有機器人方面的開發(fā)背景,就可以進行一些原來只能靠機器人或通過極高成本才能進行的工作。

4. SDN

分布式服務(wù)器中的多臺服務(wù)器該如何連接?連接之后又該如何確保數(shù)據(jù)傳送效率和實時支撐呢?SDN(Software Defined Network)由此應(yīng)運而生,它顛覆了傳統(tǒng)網(wǎng)絡(luò)搭建的邏輯,采用虛擬化技術(shù),根據(jù)應(yīng)用數(shù)據(jù)的不同使用方式,動態(tài)調(diào)整和分配資源,優(yōu)化數(shù)據(jù)的存貯和轉(zhuǎn)移。據(jù)此,SDN 技術(shù)可以為不同的用戶群建立不同的虛擬網(wǎng)絡(luò),實現(xiàn)不同的資源配置,從而使得物理網(wǎng)絡(luò)的能力被更加合理的利用。微軟現(xiàn)已開發(fā) SDN 工具幫助開發(fā)者快速部署起一套 SDN 平臺。

5. Sora

微軟亞洲研究院開源的軟件無線電項目 Sora 是一個完全可編程的高性能軟件無線電系統(tǒng),能夠快捷而有效地實現(xiàn)當(dāng)前最前沿的無線通信技術(shù)。軟硬件平臺的創(chuàng)新使 Sora 在 PC 上就可以完成高性能的無線信號處理。自2009年首次發(fā)表以來,Sora 已在學(xué)術(shù)界獲得多項最佳論文和演示大獎。目前已有50多家大學(xué)和科研機構(gòu)在教學(xué)和科研中使用 Sora 。為滿足研究者們?nèi)找嫫惹械难芯啃枨螅耆_源的 Sora 系統(tǒng)提供了大量特性,其中包括:支持定制的射頻前端,RCB 和通信模式。

6. GraphView

2015年12月16日,微軟亞洲研究院系統(tǒng)算法組開發(fā)的圖數(shù)據(jù)庫 GraphView 開源。GraphView 是一款中間件軟件,方便用戶使用關(guān)系數(shù)據(jù)庫 SQL Server 或 Azure SQL Database 高效地管理和處理大規(guī)模圖數(shù)據(jù)。GraphView 在物理數(shù)據(jù)表達以及系統(tǒng)運行行為上和原生圖數(shù)據(jù)庫完全一致,填補了關(guān)系數(shù)據(jù)庫和圖數(shù)據(jù)庫之間的鴻溝。它還繼承了關(guān)系數(shù)據(jù)庫領(lǐng)域數(shù)十年的科研成果,可以提供市面上原生圖數(shù)據(jù)庫難以媲美的性能。GraphView 的功能包括:完備的查詢語言,索引,事物處理和系統(tǒng)管理等等。

7. Graph Engine

2015年5月20日,微軟亞洲研究院 Graph Engine 1.0預(yù)覽版正式發(fā)布。Graph Engine 是一個基于內(nèi)存的分布式大規(guī)模圖數(shù)據(jù)處理引擎,能夠幫助用戶更方便地構(gòu)建實時查詢應(yīng)用和高吞吐量離線分析平臺。Graph Engine 在學(xué)術(shù)界有個更廣為人之的名稱,叫做 Trinity。此外,Graph Engine 還可與強大的集成開發(fā)環(huán)境 Visual Studio 以及微軟云計算平臺 Azure 無縫集成。無論本地開發(fā)還是云端部署,Graph Engine 都可以給開發(fā)者帶來極佳的用戶體驗。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號