背景:人類始終對“大腦”這個重要器官懷著濃濃的好奇:大腦是怎么指揮我們?nèi)粘P袨榈??八百億神經(jīng)元是如何協(xié)同傳遞信息的?經(jīng)過數(shù)年的攻關(guān),清華大學(xué)推出了綜合指標國際領(lǐng)先的多維多尺度高分辨光學(xué)顯微成像系統(tǒng)(簡稱RUSH腦成像),采用浪潮分布式存儲提供PB級容量和20.16GB/s的帶寬,承載了小鼠全腦皮層神經(jīng)元的實時成像研究。
浪潮存儲服務(wù)清華大學(xué),推進腦科學(xué)研究
近期,清華大學(xué)多維多尺度高分辨率顯微成像(簡稱RUSH腦成像)項目取得重大進展,其第二代RUSH的視場、分辨率、幀率、數(shù)據(jù)通量等綜合技術(shù)指標國際領(lǐng)先,可實現(xiàn)對小鼠全腦皮層神經(jīng)元的分布、動態(tài)功能信號傳遞過程的精準呈現(xiàn),對推動中國生命和醫(yī)學(xué)科學(xué)發(fā)展,提升腦科學(xué)研究和應(yīng)用水平具有重大戰(zhàn)略意義。
活體全腦成像 難在哪?
開展大腦研究,需要在活體動物的全腦上進行觀測和研究。因此清華大學(xué)腦科研項目組選擇了小鼠大腦率先進行全腦實時成像研究。
RUSH腦成像項目對擁有1億神經(jīng)元的小鼠大腦進行了研究
但是,這項工作的復(fù)雜性極高,要知道,小鼠大腦的神經(jīng)元胞體直徑大概只有10微米,神經(jīng)元之間連接的突觸才2~4微米,而小鼠大腦有一億個左右的神經(jīng)元,神經(jīng)元之間有千余個數(shù)據(jù)連接,即使是最簡單的神經(jīng)連接也可能跨越大腦的兩個半球,其神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度遠遠超越當今的互聯(lián)網(wǎng)。而考慮到人類大腦規(guī)模是小鼠的大腦的800倍(神經(jīng)元數(shù)量),復(fù)雜度不可同日而語。
從腦成像角度來看,要對大腦進行觀測,不僅需要寬闊的視野和極高的分辨率,還需要極高的呈現(xiàn)速度來觀測動態(tài)信號傳遞過程。
清華大學(xué)范靜濤老師表示,“在RUSH研究之前,現(xiàn)有的顯微觀測設(shè)備,要么可以實現(xiàn)足夠高的分辨率,但難以觀測到全腦;要么可以觀測到全腦神經(jīng)活動,但無法觀測到足夠的神經(jīng)元細節(jié)。主要原因是同時受制于光學(xué)成像能力和數(shù)據(jù)采集-傳輸通量瓶頸。”如今,在清華RUSH項目組的努力下,這一情況已經(jīng)被改寫。
腦成像:每秒100億像素、每天2.7PB,還不能丟幀
RUSH-II實現(xiàn)了視場大小 1平方厘米、分辨率0.4微米、幀率30幀/秒的指標,意味其能夠更好地滿足對于大腦的觀測需求。
RUSH腦成像項目在拍攝過程中每秒100億像素數(shù)據(jù)通量,每天產(chǎn)生1.5PB數(shù)據(jù)
如果說大視場、高分辨率考驗著RUSH腦成像項目的光學(xué)特性,那么要滿足“極高的呈現(xiàn)速度”這個需求,就需要數(shù)字化能力的支撐。RUSH腦成像項目有著28臺相機,每臺相機1200萬像素,在連續(xù)拍攝過程中會產(chǎn)生100.8億像素/秒的數(shù)據(jù)通量,這就意味著當其連續(xù)拍攝任務(wù)中,每天將產(chǎn)生2.7PB左右的數(shù)據(jù),存儲系統(tǒng)顯然要具備極高的容量。
“清華腦科研項目對于存儲的要求不僅在于容量,更大的挑戰(zhàn)是存儲要實時在線,不能丟幀”,清華大學(xué)范靜濤表示。例如,在研究過程中,研究人員會在小鼠血液中加入熒光劑,然后會使用RUSH中的28臺相機,以每秒30幀、連續(xù)72小時的方式對小鼠進行拍攝,最后將這些圖片拼接成三維圖像序列。由于小鼠是活體的,其血液無時無刻不在流動,相機需要去追蹤每一個細胞的流動曲線,即使出現(xiàn)一幀的丟失,也會讓研究人員無法跟蹤到全過程,3D成像的拼接也無從談起,會導(dǎo)致耗時、耗資巨大的拍攝項目功虧一簣。
除此之外,RUSH腦成像項目對于存儲系統(tǒng)所帶來的挑戰(zhàn)還有很多。比如,RUSH腦成像系統(tǒng)的攝像儀器每秒鐘會產(chǎn)生840個文件、每個文件24MB,這些海量的小文件非常考驗存儲系統(tǒng)的處理能力;又如,在某些生命科學(xué)成像觀測中,長達72小時的觀測會產(chǎn)生海量的文件,而且從第一個文件到寫滿,不能丟幀,這就需要確保長時間的穩(wěn)定寫入;再如,RUSH-II無法采用冷數(shù)據(jù)備份,所以需要采用創(chuàng)新數(shù)據(jù)冗余機制,確保數(shù)據(jù)不丟失。
分布式存儲:以智能運維,滿足PB級數(shù)據(jù)不丟幀
針對該項目的需求,浪潮提供了基于分布式存儲平臺AS13000的高性能、高可用、高穩(wěn)定性存儲解決方案,提供40個節(jié)點的存儲服務(wù),存儲空間約為5PB,滿足20.16GB/s數(shù)據(jù)通量、最長拍攝時間72小時、拍攝過程中不丟幀等嚴格要求。
分布式存儲成為新趨勢
浪潮工程師表示:“根據(jù)RUSH腦科研的應(yīng)用特征,以及對存儲系統(tǒng)性能、帶寬、擴展性、接口等需求指標,我們進行了業(yè)務(wù)模擬測試,對承載的數(shù)據(jù)量和運行時間進行實際測算,并根據(jù)用戶未來業(yè)務(wù)擴展的需求加大數(shù)據(jù)量以驗證系統(tǒng)和平臺的承載能力和性能變化,并多次對用戶設(shè)備進行匹配,對接口、外圍設(shè)備匹配、文件刪除性能等進行深度優(yōu)化。”
此外,RUSH腦成像系統(tǒng)還部署浪潮智能統(tǒng)一存儲管理平臺InView,在數(shù)百萬個文件的環(huán)境下,通過人工智能技術(shù)實現(xiàn)存儲部署、運維、管理、調(diào)優(yōu)的自動化,實現(xiàn)了對于故障盤90%以上的預(yù)測準確率。
正如IDC與浪潮在《2019數(shù)據(jù)及存儲發(fā)展報告》提到,數(shù)據(jù)存儲已經(jīng)成為承載產(chǎn)業(yè)轉(zhuǎn)型的基礎(chǔ)平臺,高效、易于擴展的分布式存儲成為趨勢,人工智能技術(shù)也將快速融入存儲系統(tǒng)的發(fā)展。而清華大學(xué)RUSH腦成像項目在數(shù)字化、智能化方面成功應(yīng)用實踐,展現(xiàn)了數(shù)據(jù)平臺在推動科研行業(yè)轉(zhuǎn)型升級方面的巨大能量。
探索生命科學(xué)的“終極疆域”
探索腦科學(xué),不僅有助于我們增進對于生命的認知,同樣也對腦疾病的治療與預(yù)防至關(guān)重要。雖然現(xiàn)代醫(yī)學(xué)已經(jīng)有了極大的發(fā)展,但是我們依然沒有找到自閉癥、抑郁癥、精神分裂癥等精神類的疾病的“特效療法”,更不用說,帕金森綜合征、阿爾茲海默癥等腦疾病正在讓數(shù)以億計的人忍受病痛的折磨。
科學(xué)家們正在向腦科學(xué)這個生命科學(xué)的“終極疆域”發(fā)起沖擊,而腦成像的研究與創(chuàng)新,則為揭開大腦的秘密帶來了新的機會。
中國腦計劃雖然起步較晚,但是發(fā)展速度非??欤?ldquo;十三五”國家科技創(chuàng)新規(guī)劃》就將“腦科學(xué)與類腦研究”列為“科技創(chuàng)新2030-重大項目”,提出搶占腦科學(xué)前沿研究制高點。2016年,中國發(fā)布了“腦科學(xué)與類腦研究”國家重大科技專項,在這個未知的前沿疆域留下了更多科研工作者的身影。
范靜濤表示,他最近在思考一件事,“縱觀世界上的顯微系統(tǒng),在小視場/低分辨率、大視場/低分辨率,小視場/高分辨率這三大領(lǐng)域,先后出現(xiàn)了二十余項諾貝爾獎,但唯獨大視場/高分辨率還未出現(xiàn)突破。”這個機會,有沒有可能來自中國,又會不會是現(xiàn)在做的方向呢?未來會給出答案。