作為時(shí)下最時(shí)髦的詞匯,“大數(shù)據(jù)技術(shù)”由于具有從各種各樣類型的數(shù)據(jù)中快速獲得有價(jià)值信息的能力而在越來越多的行業(yè)中被廣泛應(yīng)用,對(duì)包括醫(yī)藥行業(yè)在內(nèi)的眾多行業(yè)產(chǎn)生了顛覆性的影響。在近日召開的2015中國(guó)(北京)跨國(guó)技術(shù)轉(zhuǎn)移大會(huì)上,大數(shù)據(jù)成為會(huì)議關(guān)注的焦點(diǎn)內(nèi)容。在“大數(shù)據(jù)藥物創(chuàng)新專題論壇”上,眾多業(yè)內(nèi)專家從自身實(shí)踐角度,分享了對(duì)大數(shù)據(jù)的認(rèn)識(shí)以及獨(dú)到的見解,強(qiáng)調(diào)了大數(shù)據(jù)對(duì)于新藥研發(fā)的重要性。
新藥研發(fā)需要大數(shù)據(jù)支撐
藥渡經(jīng)緯信息科技(北京)有限公司執(zhí)行總裁丁紅霞博士表示,隨著網(wǎng)絡(luò)和信息技術(shù)的不斷普及,人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng),而云計(jì)算的誕生,更是直接把我們送進(jìn)了大數(shù)據(jù)時(shí)代。之前在醫(yī)藥領(lǐng)域,由于數(shù)據(jù)的采集及分析所存在的技術(shù)瓶頸,以及人們對(duì)這些數(shù)據(jù)意義認(rèn)識(shí)的不足,使大數(shù)據(jù)的價(jià)值還未被真正挖掘。近年來,隨著醫(yī)藥數(shù)據(jù)積累的加速進(jìn)行,醫(yī)藥領(lǐng)域的大數(shù)據(jù)迎來了從量變到質(zhì)變的關(guān)鍵時(shí)刻,正在對(duì)生命科學(xué)、臨床醫(yī)療、藥物研發(fā)、醫(yī)藥營(yíng)銷等領(lǐng)域產(chǎn)生革命性的重大影響。
丁紅霞介紹,創(chuàng)新藥物研發(fā)一直是所有醫(yī)藥企業(yè)面臨的難題。由于藥物的生物過程和藥物模型越來越復(fù)雜,藥物研發(fā)一直處于投入大而成功率低,以及產(chǎn)品線停滯的狀況。一個(gè)新藥研發(fā)的平均時(shí)間長(zhǎng)達(dá)15年,平均耗費(fèi)超過8億美元,其研發(fā)產(chǎn)業(yè)鏈包括了海量研發(fā)數(shù)據(jù)的搜尋、消化,涉及化學(xué)、生物學(xué)、毒理學(xué)、制劑學(xué)、專利學(xué)等各個(gè)學(xué)科的資源合作,以及與監(jiān)管、審批部門的溝通,資本的投入及退出,產(chǎn)業(yè)化園區(qū)的選擇等等眾多環(huán)節(jié)。但是,目前藥物研發(fā)整體仍處于“各自為戰(zhàn),單打獨(dú)斗”的狀態(tài)。雖然整個(gè)行業(yè)逐年投入大量的人力、物力,但眾多的重復(fù)性工作使其獲得的研發(fā)信息、研發(fā)資源配置效率低下,這種狀況有時(shí)甚至?xí)?duì)一個(gè)藥物研發(fā)項(xiàng)目造成致命的損害。
“大數(shù)據(jù)的應(yīng)用是解決藥物研發(fā)周期長(zhǎng)、成本高、不確定因素多等問題的重要技術(shù)支撐。”丁紅霞認(rèn)為,通過使用大數(shù)據(jù),研究人員可以從基因組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué),協(xié)同臨床試驗(yàn)數(shù)據(jù)和真實(shí)世界臨床數(shù)據(jù)進(jìn)行挖掘,通過預(yù)測(cè)建模來幫助我們識(shí)別那些很有可能被成功開發(fā)為藥物的安全有效的潛力備選新分子,找出更有效的靶位、標(biāo)記物、活性物質(zhì)等進(jìn)行驗(yàn)證,以及在后續(xù)的動(dòng)物實(shí)驗(yàn)及臨床Ⅰ~Ⅲ期的臨床試驗(yàn)數(shù)據(jù)中更加有效地進(jìn)行篩選工作,從而縮短整個(gè)藥物研發(fā)的時(shí)間。
不僅如此,在制藥產(chǎn)業(yè)鏈眾多能產(chǎn)生數(shù)據(jù)統(tǒng)計(jì)的其他環(huán)節(jié),大數(shù)據(jù)的使用同樣能發(fā)揮它的作用:幫助藥物監(jiān)管、審批部門了解目前整個(gè)中國(guó)乃至世界的藥物研發(fā)現(xiàn)狀、審批情況、藥物使用情況等信息,以便在工作中更好地發(fā)揮自身職能;幫助市場(chǎng)資本更好地選擇項(xiàng)目的投入及適時(shí)退出;幫助生物技術(shù)公司更明智地選擇融資,進(jìn)行產(chǎn)業(yè)化;幫助產(chǎn)業(yè)化園區(qū)挑選最有前景的項(xiàng)目落地,以及給予更有回報(bào)前景的支持。“在藥物研發(fā)整個(gè)板塊的各個(gè)環(huán)節(jié)提供大數(shù)據(jù)支撐,建立研發(fā)資源有效配置的平臺(tái),對(duì)于整個(gè)醫(yī)藥產(chǎn)業(yè)將產(chǎn)生難以估量的影響。”丁紅霞強(qiáng)調(diào)。
用大數(shù)據(jù)配置優(yōu)選研發(fā)資源
“2013年美國(guó)食品藥品管理局(FDA)批準(zhǔn)了26個(gè)新分子實(shí)體(NMEs),2014年則批準(zhǔn)了41個(gè)NMEs,逐年上升。2011~2014年,我國(guó)新藥的上市申請(qǐng)也平穩(wěn)上升。”藥渡經(jīng)緯信息科技(北京)有限公司創(chuàng)始人李靖博士在介紹了當(dāng)前世界和我國(guó)新藥研發(fā)的總體形勢(shì)后強(qiáng)調(diào):“新藥研發(fā)是一項(xiàng)復(fù)雜的系統(tǒng)工程,包括臨床前的靶點(diǎn)鑒定、藥物活性篩選、非臨床動(dòng)物模型研究、臨床研究等,而數(shù)據(jù)的積累對(duì)于各個(gè)環(huán)節(jié)有著不可或缺的作用。目前,藥物研發(fā)工作對(duì)于數(shù)據(jù)服務(wù)的要求越來越緊迫。”
李靖表示,做藥物創(chuàng)新必須要進(jìn)行文獻(xiàn)調(diào)研,需要研讀相關(guān)藥物的化學(xué)、生物學(xué)、毒性、臨床研究等資料,從而掌握相關(guān)信息。比如,每年有25~30個(gè)糖尿病治療新藥上市,每個(gè)新藥的文獻(xiàn)資料約兩萬多頁(yè),那么要開發(fā)一個(gè)糖尿病治療新藥,需要把所有已上市新藥的相關(guān)信息都閱讀一遍,但這約有近100萬頁(yè)的閱讀量。“閱讀完這么大的文獻(xiàn)量確實(shí)可以成為專家,但也就沒有時(shí)間做創(chuàng)新了。這是有限的生命與研發(fā)之間的最大矛盾”。
李靖認(rèn)為,對(duì)于藥物研發(fā)人員來說,將龐大的數(shù)據(jù)如2萬~3萬頁(yè)的文獻(xiàn)資料變成10頁(yè),不僅可以很快地了解歷史,還能迅速應(yīng)對(duì)將來的研發(fā)工作。對(duì)于藥物審評(píng)人員來說,通過數(shù)據(jù)及時(shí)了解已上市藥物的相關(guān)信息,提出的審評(píng)意見也會(huì)更加“靠譜”。“大數(shù)據(jù)提供的東西讓全世界的競(jìng)爭(zhēng)者都站在同一起跑線上。”李靖說,藥渡的使命就是利用大數(shù)據(jù)技術(shù),打造一個(gè)“綜合性,一站式的藥物研發(fā)信息服務(wù)平臺(tái)”,為個(gè)性化的藥物研發(fā)提供精煉的研發(fā)數(shù)據(jù),配置優(yōu)選的研發(fā)資源。
中康醫(yī)藥資訊(集團(tuán))有限公司的楊大洲則從進(jìn)口藥物注冊(cè)的角度,展示了如何利用大數(shù)據(jù)把國(guó)外優(yōu)質(zhì)的藥物引進(jìn)國(guó)內(nèi)。對(duì)于進(jìn)口藥物,傳統(tǒng)的途徑是國(guó)外熟人或中介推薦,但中間人推薦將使選擇范圍縮小,也許只能篩選某個(gè)國(guó)家、個(gè)別廠家的品種,這將大大降低匹配率,需要企業(yè)提供更加聚焦的篩選范圍。而由公司研發(fā)部或市場(chǎng)部人員從Google、各大公司網(wǎng)站等調(diào)研海量的藥物信息,費(fèi)時(shí)費(fèi)力。而利用中康的數(shù)據(jù)資源,可以根據(jù)銷售數(shù)據(jù)庫(kù)對(duì)產(chǎn)品的市場(chǎng)成長(zhǎng)力進(jìn)行篩選,根據(jù)藥品綜合信息庫(kù)進(jìn)行初步信息確認(rèn),檢索國(guó)內(nèi)注冊(cè)受理數(shù)據(jù)庫(kù)了解產(chǎn)品申報(bào)風(fēng)險(xiǎn),檢索全球臨床試驗(yàn)庫(kù)評(píng)估產(chǎn)品的學(xué)術(shù)地位,檢索全球已上市藥物數(shù)據(jù)庫(kù)篩選合適標(biāo)的,從而幫助企業(yè)篩選出優(yōu)質(zhì)的國(guó)際合作項(xiàng)目。
應(yīng)對(duì)大數(shù)據(jù)面臨的挑戰(zhàn)
湯森路透生命科學(xué)事業(yè)部中國(guó)區(qū)總經(jīng)理胡大龍介紹,大數(shù)據(jù)具有規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)、價(jià)值性(Value)的“4V”特性。在大數(shù)據(jù)時(shí)代,各機(jī)構(gòu)都“被迫”更好地利用他們可獲得的數(shù)據(jù),而面對(duì)大量數(shù)據(jù)的所有權(quán),面臨的真正挑戰(zhàn)是對(duì)于數(shù)據(jù)的整合、分析與解讀能力。
“制藥行業(yè)對(duì)信息情報(bào)的解決方案就是整合。”胡大龍表示,藥物研發(fā)的關(guān)鍵信息有許多,包括:藥物化合物,合成路徑,化學(xué)反應(yīng),蛋白、基因序列,生物藥、化藥的基本信息,全球?qū)@畔ⅲ?cái)經(jīng)信息,競(jìng)爭(zhēng)情報(bào),市場(chǎng)調(diào)研,多領(lǐng)域、多學(xué)科的研發(fā)文獻(xiàn)等,而通過信息整合技術(shù)(情報(bào)管理及可視化技術(shù)),可以讓這些信息產(chǎn)生高附加值的應(yīng)用:如靶標(biāo)的確定及認(rèn)證、先導(dǎo)化合物的確認(rèn)及優(yōu)化、藥物研發(fā)途徑的選擇、高效的臨床研究、知識(shí)產(chǎn)權(quán)保護(hù)、跟蹤競(jìng)爭(zhēng)者的活動(dòng)、戰(zhàn)略策劃等。在整合的基礎(chǔ)上,還需要進(jìn)行4種類型的數(shù)據(jù)分析解讀——規(guī)范性分析、描述性分析、預(yù)測(cè)性分析和診斷性分析。
胡大龍認(rèn)為,數(shù)據(jù)無處不在。疾病的數(shù)據(jù),包括疾病基礎(chǔ)醫(yī)學(xué)及市場(chǎng)數(shù)據(jù)、流行病學(xué)調(diào)研數(shù)據(jù),以及診斷方法及信息、治療手段及方法、治療藥物研發(fā)及產(chǎn)品管線等數(shù)據(jù);靶點(diǎn)機(jī)制的數(shù)據(jù),包括最新的作用機(jī)制、靶點(diǎn)的發(fā)展、流行熱點(diǎn)靶點(diǎn)分布、靶點(diǎn)機(jī)制認(rèn)證、相關(guān)藥物管線進(jìn)展、藥物研發(fā)相關(guān)生物標(biāo)記物等數(shù)據(jù);化合物的數(shù)據(jù),包括化合物的基礎(chǔ)科研,藥理、藥代、毒理,化合物的構(gòu)效關(guān)系,全合成路徑,文獻(xiàn)及專利,動(dòng)物實(shí)驗(yàn)?zāi)P偷葦?shù)據(jù);仿制藥的數(shù)據(jù),包括原研藥的藥理、臨床數(shù)據(jù),和化學(xué)合成、放大工藝等技術(shù),配方技術(shù)開發(fā),新劑型的研究數(shù)據(jù),以及市場(chǎng)競(jìng)爭(zhēng)產(chǎn)品分析、仿制藥競(jìng)爭(zhēng)分析、專利到期日的分析數(shù)據(jù)等。制藥行業(yè)大數(shù)據(jù)整合、分析的應(yīng)用,就是要在治療領(lǐng)域選擇戰(zhàn)略決策,進(jìn)行靶點(diǎn)機(jī)制開發(fā)的風(fēng)險(xiǎn)評(píng)估、熱點(diǎn)品種的立項(xiàng)調(diào)研和仿制藥的立項(xiàng)篩選,以及控制合作交易風(fēng)險(xiǎn)和制定策略。
“由于大數(shù)據(jù)技術(shù)的介入,藥品研發(fā)的產(chǎn)業(yè)格局必將發(fā)生改變,有效地辨識(shí)其中的機(jī)遇與風(fēng)險(xiǎn),將成為藥物研發(fā)企業(yè)成敗的關(guān)鍵。”胡大龍說。