人和未來刷新世界紀(jì)錄 助力生物信息云計(jì)算

責(zé)任編輯:editor004

2016-11-09 11:07:06

摘自:重慶晚報(bào)

摘要:2016年11月4日,基因組云計(jì)算技術(shù)開發(fā)者大會(huì)(GCTA)在第11屆國(guó)際基因組學(xué)大會(huì)(ICG)上正式公布了歷時(shí)6個(gè)月的全球公開競(jìng)賽結(jié)果

2016年11月4日,基因組云計(jì)算技術(shù)開發(fā)者大會(huì)(GCTA)在第11屆國(guó)際基因組學(xué)大會(huì)(ICG)上正式公布了歷時(shí)6個(gè)月的全球公開競(jìng)賽結(jié)果。

本屆大賽由今年4月份成立的“中國(guó)生物信息云計(jì)算產(chǎn)業(yè)聯(lián)盟”倡導(dǎo)發(fā)起,集聚華大基因、阿里云、英特爾、百度開放云、華為等單位的技術(shù)開發(fā)力量,通過匯聚BT和IT行業(yè)精英,共同解決基因組學(xué)數(shù)據(jù)大規(guī)模存儲(chǔ)和計(jì)算等方面所面臨的挑戰(zhàn)。

在眾多BT和IT行業(yè)精英中,人和未來脫穎而出,成為本屆大賽最大的黑馬。人和未來CTO宋卓博士代表GTX團(tuán)隊(duì)領(lǐng)取了獎(jiǎng)杯和證書。人和未來在數(shù)據(jù)壓縮和計(jì)算加速兩個(gè)項(xiàng)目上的成績(jī)均刷新了世界紀(jì)錄,同時(shí)保持了最低的計(jì)算成本,將全基因組的計(jì)算分析帶入百元(16$)時(shí)代。

此次大賽的競(jìng)賽項(xiàng)目分為以下2個(gè):

1、 數(shù)據(jù)存儲(chǔ)問題:FASTQ數(shù)據(jù)的高倍數(shù)無損壓縮

將一個(gè)原始FASTQ格式的150GBDNA測(cè)序數(shù)據(jù)文件無損壓縮至原來的1/15。

2、 分析計(jì)算問題:高效的人類全基因數(shù)據(jù)分析

30分鐘完成55x人類全基因組數(shù)據(jù)標(biāo)準(zhǔn)分析。

這兩個(gè)選題瞄準(zhǔn)的是生物信息云計(jì)算中最重要的兩個(gè)問題——壓縮和計(jì)算。只有高效的壓縮才便于大規(guī)模向云端傳輸數(shù)據(jù),降低云端存儲(chǔ)成本;只有高效的計(jì)算才能充分體現(xiàn)云端彈性計(jì)算應(yīng)有的優(yōu)勢(shì)。解決好這兩個(gè)問題,就能站在技術(shù)制高點(diǎn)上,推動(dòng)生物信息云計(jì)算行業(yè)的發(fā)展。

雙料王,人和未來的兩項(xiàng)成績(jī)均刷新世界紀(jì)錄

本次比賽項(xiàng)目的難度和要求都非常高,吸引了全球300多家機(jī)構(gòu)和個(gè)人的參賽,誕生了令人驚喜的成績(jī),首屆GCTA風(fēng)云挑戰(zhàn)賽完美收官。兩項(xiàng)比賽第一名的最好成績(jī)均由人和未來生物科技 (北京)有限公司獲得,性能如下:

1. 壓縮存儲(chǔ):7個(gè)測(cè)序質(zhì)量值下,壓縮率達(dá)到1/18;33個(gè)測(cè)序質(zhì)量值下,壓縮率達(dá)到1/8。

與行業(yè)默認(rèn)標(biāo)準(zhǔn)gzip相比,計(jì)算時(shí)間為其1/6且壓縮后文件大小為其1/4,即壓縮效率是gzip性能的24倍。 在這樣的極高倍率壓縮技術(shù)的支持下, 使用百兆網(wǎng)絡(luò),就能達(dá)到以千兆速度上傳數(shù)據(jù)的效果, 使得大規(guī)模測(cè)序數(shù)據(jù)上云成為可能。 此外,若按照AWS云每gb云存儲(chǔ)成本0.03美金/月計(jì)算。該高倍率壓縮技術(shù)將能讓每1000人的測(cè)序數(shù)據(jù)云存儲(chǔ),每月節(jié)省1.1萬美金,大幅降低云存儲(chǔ)成本。 該技術(shù)突破,作為一項(xiàng)重要的基礎(chǔ)性工作,為整個(gè)行業(yè)的基因信息計(jì)算上云鋪平了道路。

2. 加速計(jì)算:18分鐘完成400G 55x人類全基因組分析。

不僅如此,人和未來在計(jì)算加速比賽的成績(jī)也刷新了世界記錄:400G(55x)全基因組數(shù)據(jù)分析,利用AWS上的300臺(tái)機(jī)器,將分析時(shí)間從單臺(tái)服務(wù)器的30個(gè)小時(shí),縮短為18分鐘,機(jī)時(shí)費(fèi)用僅為$16,將全基因組計(jì)算帶入百元時(shí)代。對(duì)比單臺(tái)標(biāo)準(zhǔn)服務(wù)器,數(shù)據(jù)分析速度提高了90倍,可節(jié)約75%的云計(jì)算機(jī)時(shí)費(fèi)用。

基因測(cè)序技術(shù)日漸普及,基因檢測(cè)的核心競(jìng)爭(zhēng)力已經(jīng)不僅限于測(cè)序產(chǎn)生數(shù)據(jù)的能力,大數(shù)據(jù)、高性能計(jì)算、機(jī)器學(xué)習(xí)這些IT領(lǐng)域里面的熱詞和標(biāo)簽會(huì)出現(xiàn)在越來越多的基因檢測(cè)公司身上。BT與IT的結(jié)合,相信能實(shí)現(xiàn)技術(shù)創(chuàng)新,用科技的力量推動(dòng)和加快精準(zhǔn)醫(yī)療的發(fā)展,對(duì)全行業(yè)發(fā)展具有重大意義。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)