這兩位創(chuàng)業(yè)者說大數(shù)據(jù)能治療癌癥

責(zé)任編輯:editor006

2014-07-27 10:12:26

摘自:騰訊科技

表弟這段令人痛苦的求生經(jīng)歷,讓特納和溫伯格開始思考,他們可以做些什么來幫助其他有類似遭遇的人。公司還聘請(qǐng)了50名護(hù)士,手工輸入了500名患者的數(shù)據(jù),從而獲得了特納所說的“訓(xùn)練集”,它可以用來檢測(cè)自動(dòng)收集的數(shù)據(jù)中的錯(cuò)誤。

這位創(chuàng)業(yè)者說大數(shù)據(jù)能治療癌癥

奈特-特納(Nat Turner)和扎克-溫伯格(Zach Weinberg)

你以前可能也曾聽說過這樣的故事:兩個(gè)計(jì)算機(jī)神童在一所著名大學(xué)里相遇,對(duì)計(jì)算機(jī)的熱愛讓他們覺得志同道合,經(jīng)過幾次熬夜編程之后,兩人創(chuàng)建了一個(gè)網(wǎng)站或者應(yīng)用。很快,這個(gè)小小的副業(yè)就變成了一個(gè)創(chuàng)業(yè)項(xiàng)目,他們從投資者那里獲得了大筆資金,并創(chuàng)建了一家公司,兩人也在一夜之間搖身變成百萬富翁——至少是賬面上的百萬富翁。

乍看上去,奈特-特納(Nat Turner)和扎克-溫伯格(Zach Weinberg)的經(jīng)歷似乎也和這個(gè)故事如出一轍。兩人在賓夕法尼亞大學(xué)新生入學(xué)的第一天相遇,很快就成了好朋友。如今年僅28歲的兩個(gè)人已經(jīng)在紐約擁有自己的初創(chuàng)公司。但他們的夢(mèng)想比大多數(shù)創(chuàng)業(yè)者的都更加宏大。兩人的初創(chuàng)公司不是大行其道的社交網(wǎng)絡(luò)、照片共享應(yīng)用,或交友網(wǎng)站。他們也沒有為青少年提供在手機(jī)上談情說愛或者訂購夜宵的工具。

他們?cè)趦赡昵皠?chuàng)辦的公司Flatiron Health瞄準(zhǔn)了醫(yī)療界的一個(gè)重大難題。特納和溫伯格希望能夠收集和分析堆積如山的臨床資料,以便在醫(yī)療界最復(fù)雜、最困難、最有賴于研究的領(lǐng)域中開辟一條道路,這個(gè)領(lǐng)域就是癌癥的治療——雖說兩人在沃頓商學(xué)院攻讀經(jīng)濟(jì)學(xué)和創(chuàng)業(yè)專業(yè),并沒有時(shí)間上太多的生物課。

但是,在你暗暗發(fā)笑之前,不妨先看看他們以往的經(jīng)歷。Flatiron Health已經(jīng)是兩人聯(lián)合創(chuàng)辦的第三家公司了。他們第一次創(chuàng)業(yè)是為大學(xué)生提供網(wǎng)上食品訂購服務(wù),結(jié)果失敗了。在讀大三的時(shí)候,他們創(chuàng)辦了第二家公司Invite Media,希望利用大數(shù)據(jù)技術(shù),讓數(shù)字營銷變得更加有效。這一次他們大獲成功,以至于谷歌——大數(shù)據(jù)計(jì)算領(lǐng)域的教父,也是世界上最大的數(shù)字廣告公司——在2010年以逾8000萬美元的價(jià)格收購了Invite Media。

“狂妄自大”

現(xiàn)在,谷歌已經(jīng)再次向特納和溫伯格打開了支票簿——通過旗下的谷歌風(fēng)險(xiǎn)投資公司,向他們的第三家公司Flatiron Health投資了1億多美元(該公司總共融資1.38億美元)。但這兩位年輕的廣告技術(shù)專家,獲得的卻不僅僅是谷歌的青睞。

杜克大學(xué)醫(yī)學(xué)教授艾米-阿伯內(nèi)西(Amy Abernethy)是一位著名的腫瘤學(xué)家,她雖然明知Flatiron Health要實(shí)現(xiàn)目標(biāo)并不容易,但是該公司用徹底的、系統(tǒng)化的方式來收集和整理臨床數(shù)據(jù)的做法,卻給她留下了深刻印象,因此她決定今年7月加盟Flatiron Health,成為該公司的首席醫(yī)療官。

“我把自己的聲譽(yù)押注在了Flatiron Health上,”阿伯內(nèi)西說。之前她一直在主持杜克大學(xué)的癌癥治療研究計(jì)劃,而且也曾參與過早期一些利用大量臨床數(shù)據(jù)來提高癌癥治療水平的“過分樂觀的”項(xiàng)目。

拋開這樣的認(rèn)可(以及谷歌的資金)不談,這件事情的“狂妄自大”程度令人側(cè)目——兩個(gè)長著娃娃臉的科技業(yè)人士,希望給癌癥治療方式帶來重大影響,這可是大量科研人員和訓(xùn)練有素的醫(yī)生尚未辦到的事情。對(duì)此,身為Flatiron Health首席執(zhí)行官的特納既謙遜又無畏。 “我們正在建設(shè)一家高科技公司,只不過它恰好位于癌癥治療領(lǐng)域。”他說。

根據(jù)Flatiron Health的說法, 癌癥患者的治療數(shù)據(jù)目前只有一小部分獲得了系統(tǒng)化的收集;這些資料主要出現(xiàn)在隨機(jī)臨床試驗(yàn)中,涵蓋了約4%的成年癌癥患者(雖然對(duì)這個(gè)數(shù)字的估計(jì)各有不同)。Flatiron Health認(rèn)為,從余下的約96%的資料中收集和整理出更多信息,然后把它們反饋給醫(yī)生,可以幫助醫(yī)生制定出更好的癌癥治療方案。

從理論上講,醫(yī)生可以從中看到哪種治療方法對(duì)于有類似情況的大部分患者效果最好,而且,舉例來說,他們也可以把自己治療胃癌的狀況與全國各地其他專家的治療狀況進(jìn)行比較,并迅速糾正一些問題。這些數(shù)據(jù)還可以讓他們了解到哪些治療方案有最好的成本效益,并且它們還有助于把更多患者和恰當(dāng)?shù)呐R床試驗(yàn)匹配起來,可能會(huì)加快新藥的開發(fā)和批準(zhǔn)過程。

信念堅(jiān)定

特納和溫伯格不是在宣傳高科技烏托邦,不是在說大數(shù)據(jù)可以根除癌癥的負(fù)擔(dān),但是他們希望,這可以帶來有意義的成果。“我們只是在說,如果我們從其他行業(yè)學(xué)到了一個(gè)經(jīng)驗(yàn),那就是數(shù)據(jù)具有價(jià)值,”特納說。“這個(gè)價(jià)值究竟有多大,我們還不知道。”即使成果很小,那也可能會(huì)影響數(shù)以百萬計(jì)的人。

“如果整體來說,我們能對(duì)癌癥產(chǎn)生5%的影響......”他沒有繼續(xù)說下去。2014年美國新診斷出的癌癥患者有將近170萬人,如果患者的生存率整體提高5%,相當(dāng)于僅在今年就拯救了數(shù)以萬計(jì)的生命。

特納的父親是一名地球物理學(xué)家,在石油勘探行業(yè)工作。特納年少時(shí)在德州、路易斯安那州、荷蘭和蘇格蘭居住過。雖然淺棕色的頭發(fā)已經(jīng)開始后褪,露出他寬闊的前額,但特納的面龐看上去仍像是個(gè)研究生。

成功的連續(xù)創(chuàng)業(yè)者往往相當(dāng)招搖,成功的創(chuàng)新者也常常帶著一種自信可以改變世界的專橫,但特納既不招搖也不專橫。他和在曼哈頓上西城長大的溫伯格擁有一個(gè)共同的堅(jiān)定信念:在挽救癌癥患者的生命方面,技術(shù)可以發(fā)揮重大作用。“當(dāng)你對(duì)醫(yī)療領(lǐng)域和腫瘤學(xué)有所了解,你就會(huì)發(fā)現(xiàn),一個(gè)謙虛精干的團(tuán)隊(duì),可以幫助解決那里存在的很多問題。”溫伯格說。

特納最初對(duì)癌癥產(chǎn)生興趣是在2009年,當(dāng)時(shí)他和家人到北卡羅來納州度假的時(shí)候,他7歲的表弟布倫南-西姆金斯(Brennan Simkins)生了病,經(jīng)過一系列測(cè)試,他被確診患有急性髓系白血病。接下來的一年中,這個(gè)孩子經(jīng)歷了骨髓移植、復(fù)發(fā)、再移植,再復(fù)發(fā)??傊?,西姆金斯不僅忍受了4次痛苦的骨髓移植,還經(jīng)歷過一些誤診。不過2011年之后,西姆金斯的病情得到了緩解。

表弟這段令人痛苦的求生經(jīng)歷,讓特納和溫伯格開始思考,他們可以做些什么來幫助其他有類似遭遇的人。他們考慮創(chuàng)辦一家新公司,最初的想法是通過互聯(lián)網(wǎng)提供治療的參考意見。兩人花了六個(gè)月時(shí)間來了解癌癥。他們?cè)诳死锵<{-耶斯萬特(Krishna Yeshwant,是名醫(yī)生,也是谷歌風(fēng)險(xiǎn)投資公司從事生命科學(xué)領(lǐng)域投資的合伙人)的不時(shí)陪伴下,走訪了60多家癌癥中心,與專家們交談,和醫(yī)生們一起查房,并和他們討論各種商業(yè)理念的可能性。

經(jīng)過數(shù)十次這樣的交談后,特納和溫伯格產(chǎn)生了一個(gè)新想法。有大量臨床數(shù)據(jù)散落在全國各地腫瘤治療中心的備案系統(tǒng)中,他們想收集這些數(shù)據(jù)——通過數(shù)字和其他方式——然后整理它們,聚合它們,并把他們反饋給醫(yī)生,幫助醫(yī)生在如何治療患者方面做出更好的決定。

迎難而上

對(duì)于特納和溫伯格這樣的數(shù)據(jù)極客來說,臨床腫瘤學(xué)在數(shù)據(jù)方面的問題既明顯又熟悉。盡管醫(yī)療機(jī)構(gòu)多年前就開始說服醫(yī)生和醫(yī)院接受電子病歷(簡稱EMR),但是要獲得和使用腫瘤數(shù)據(jù)仍然十分困難。

“EMR的數(shù)據(jù)太爛了,”特納說。同一個(gè)病人的數(shù)據(jù)可能分散在很多地方:內(nèi)科、腫瘤科、放射科、外科、實(shí)驗(yàn)室和病理報(bào)告處等等。即使進(jìn)行了數(shù)字化,數(shù)據(jù)也往往采用的是非結(jié)構(gòu)化格式。它會(huì)以不同的格式,出現(xiàn)在不同的實(shí)驗(yàn)室報(bào)告和記錄中,而不是有條理地歸整在數(shù)據(jù)庫中。

更糟糕的是,仍然有大量數(shù)據(jù)隱藏在手寫和掃描的報(bào)告中,隱藏在沒人會(huì)去聽的音頻報(bào)告中,或者以低分辨率的PDF文件格式印在傳真紙上。此外,五花八門的不兼容的系統(tǒng),以及嚴(yán)格的關(guān)于個(gè)人健康信息的隱私法規(guī),更是讓數(shù)據(jù)在數(shù)以千計(jì)的腫瘤治療者之間共享變得難上加難。

從理論上講,電子病歷應(yīng)該讓這樣的數(shù)據(jù)聚合和整合變得容易。但實(shí)際上沒有這么簡單,就拿癌癥患者經(jīng)常要做白蛋白測(cè)試來說,同一家癌癥診所采用的同一種電子病歷中就存在30多個(gè)不同格式。乘上100多種不同的蛋白質(zhì)和基因測(cè)試、切片,以及癌癥診療中使用的其他診斷方法——然后再乘以不同的電子病歷系統(tǒng),不同的癌癥中心的數(shù)量——這下你知道有多復(fù)雜了吧。

Flatiron Health把這些信息綜合到一張表格中,方式是(a)對(duì)于不同的癌癥中心和實(shí)驗(yàn)室,創(chuàng)建一個(gè)通用的數(shù)據(jù)模型,(b)通過匹配算法處理數(shù)據(jù);對(duì)于這些數(shù)據(jù)使用的術(shù)語,該算法可以識(shí)別出其中90%,(c)使用一個(gè)數(shù)據(jù)處理引擎,實(shí)時(shí)轉(zhuǎn)碼術(shù)語,及(d)標(biāo)出任何不匹配的術(shù)語,由醫(yī)生或護(hù)士進(jìn)行人工識(shí)別。

一開始,特納和溫伯格花了兩年多時(shí)間來研發(fā)他們所說的數(shù)據(jù)模型,這個(gè)模型可以把海量臨床信息整理成有條理的類別。他們很快就意識(shí)到,同時(shí)對(duì)每種癌癥都采用這個(gè)方法太過復(fù)雜。因此,他們?cè)谝恍┽t(yī)生的幫助下,把側(cè)重點(diǎn)放在了結(jié)腸癌上。他們從已經(jīng)發(fā)表的臨床試驗(yàn)報(bào)告中提取一切信息,比如人口統(tǒng)計(jì)內(nèi)容和居住地,癌癥的分期,對(duì)療法的反應(yīng)等等,一共有350多個(gè)數(shù)據(jù)類別。然后他們?cè)谄渌愋偷陌┌Y上重復(fù)這個(gè)過程。

為了能自動(dòng)從電子病歷提取數(shù)據(jù),F(xiàn)latiron Health采用的多種計(jì)算機(jī)技術(shù),比如從實(shí)驗(yàn)室報(bào)告中尋找數(shù)值的匹配算法。他們還微調(diào)了自然語言處理技術(shù),讓計(jì)算機(jī)能夠“讀取”文件,并從中提取數(shù)據(jù)。由于這種系統(tǒng)非常容易出錯(cuò),所以Flatiron Health又開發(fā)了一個(gè)混合人機(jī)學(xué)習(xí)系統(tǒng),以便捕捉和糾正錯(cuò)誤。

公司還聘請(qǐng)了50名護(hù)士,手工輸入了500名患者的數(shù)據(jù),從而獲得了特納所說的“訓(xùn)練集”,它可以用來檢測(cè)自動(dòng)收集的數(shù)據(jù)中的錯(cuò)誤。然后把差異反饋給系統(tǒng),以便完善這個(gè)自動(dòng)收集過程。從理論上說,這是一個(gè)動(dòng)態(tài)的系統(tǒng),可以持續(xù)提高自身精度。

其他項(xiàng)目

Flatiron Health并不是擔(dān)負(fù)起這個(gè)使命的第一個(gè)組織。去年,非營利性專業(yè)協(xié)會(huì)“美國臨床腫瘤學(xué)會(huì)”(American Society of Clinical Oncology)推出了CancerLinQ,旨在開發(fā)一個(gè)挖掘臨床數(shù)據(jù)庫的系統(tǒng),以便提高醫(yī)療質(zhì)量,加快藥物的開發(fā)進(jìn)程。

由資深計(jì)算機(jī)科學(xué)家馬蒂-鮑姆(Marty Tenenbaum)執(zhí)掌的癌癥聯(lián)盟會(huì)(Cancer Commons)是一個(gè)非營利組織,它希望能進(jìn)一步推進(jìn)腫瘤領(lǐng)域臨床數(shù)據(jù)的標(biāo)準(zhǔn)化。而IBM也利用它的沃森人工智能系統(tǒng),和紀(jì)念斯隆凱特琳癌癥醫(yī)院(Memorial Sloan Kettering)等癌癥中心合作,篩選數(shù)以百萬計(jì)的臨床資料、期刊文章內(nèi)容,以及臨床試驗(yàn)報(bào)告,以便自動(dòng)為醫(yī)生提供治療方案的建議。此外,美國國家癌癥研究所(National Cancer Institute)還耗資5億美元,開展了一個(gè)名為“caBIG”的大型生物信息學(xué)項(xiàng)目。

早期的項(xiàng)目要么非常失敗,要么尚未取得積極成果。阿伯內(nèi)西曾擔(dān)任CancerLinQ顧問委員會(huì)主席,還參與過其他用數(shù)字方式編輯臨床腫瘤學(xué)數(shù)據(jù)的項(xiàng)目,她說,F(xiàn)latiron Health令她印象深刻的地方是專注于數(shù)據(jù)的復(fù)雜性。特納和溫伯格清醒地認(rèn)識(shí)到,“試圖解決這個(gè)問題,只有技術(shù)是行不通的,”她說,“這就是為什么我決定與他們共事的原因。”

谷歌風(fēng)險(xiǎn)投資公司的投資不僅提升了Flatiron Health的聲望,而且讓它有了收購Altos Solutions公司的資金。Altos Solutions為腫瘤學(xué)領(lǐng)域提供電子病歷服務(wù),其總部設(shè)在加州山景城,和谷歌相隔不遠(yuǎn)。收購該公司給Flatiron Health帶來了更大的用戶群,也讓它進(jìn)一步密切了與醫(yī)師之間的聯(lián)系。目前有210個(gè)癌癥中心正在使用Flatiron Health的系統(tǒng),這些中心目前每年會(huì)接收30萬新患者。雖然其中大多數(shù)都是社區(qū)腫瘤診所,但也有一些大型學(xué)術(shù)機(jī)構(gòu)。谷歌說,進(jìn)行這項(xiàng)投資的部分原因,是為了加快這個(gè)前途光明的領(lǐng)域出成果的過程。 “如果不收購Altos Solutions,它可能還需要研發(fā)一代電子病歷,才能獲得廣泛使用,我們想避免這種情況發(fā)生,” 谷歌風(fēng)險(xiǎn)投資公司的負(fù)責(zé)人比爾-馬里斯(Bill Maris)說。“我希望能早日免除很多人的傷心和苦痛。”

在長島郊區(qū)工作的杰弗里-維西卡(Jeffrey Vacirca)醫(yī)生看好Flatiron Health的前景。他使用Altos 電子病歷系統(tǒng)已經(jīng)有好幾年時(shí)間,它幫助維西卡改善了治療方案,但它的許多潛力仍未發(fā)揮出來。 “系統(tǒng)中有大量數(shù)據(jù),但沒有人整理出來,也沒有人知道它們的價(jià)值,” 維西卡說,“我認(rèn)為,這就是Flatiron Health工作的重要性所在。他們整理各種細(xì)節(jié)數(shù)據(jù),整理數(shù)以百萬計(jì)的患者的治療結(jié)果,他們可以評(píng)估、分類,辨識(shí)出哪些做法真的有效。” 維西卡稱,F(xiàn)latiron Health系統(tǒng)是“治療癌癥的基礎(chǔ)設(shè)施”。有了它,他就能了解自己采用的醫(yī)療方法是否在某些方面落后于其他療法。他還可以了解到,是否有更多的患者可以參加臨床試驗(yàn)。“如果積攢病人的速度比以前快5倍,你可以想一想,藥品完成監(jiān)管程序的速度可以快多少。”他說。

疑慮猶存

在談到長期的抗癌斗爭時(shí),該領(lǐng)域的一些頂尖人士仍然對(duì)大數(shù)據(jù)承諾的前景持懷疑態(tài)度。前沿研究員羅伯特-溫伯格(Robert Weinberg)是麻省理工學(xué)院懷特黑德生物醫(yī)學(xué)研究所(Whitehead Institute for Biomedical Research)的創(chuàng)始成員之一,他最近在《Cell》雜志上發(fā)表文章,談到了大數(shù)據(jù)和癌癥之間起伏不定的關(guān)系。文章指出,從蛋白質(zhì)之間的交叉影響到腫瘤突變,各種數(shù)據(jù)集的爆炸式增長,已經(jīng)讓研究人員解釋它們的能力變得不堪重負(fù)。他還在一次采訪中表示, “有些人著迷于生物信息學(xué),認(rèn)為僅僅需要聚合數(shù)據(jù),就可以獲得前所未有的、定性式的見解,我對(duì)這種看法不敢茍同。”

約翰-羅安迪斯(John Ioannidis)是斯坦福大學(xué)的醫(yī)藥保健研究和政策教授,他的看法也僅僅比羅伯特-溫伯格稍微樂觀一點(diǎn)。羅安迪斯認(rèn)為,通過一個(gè)中央系統(tǒng),把患者的基本資料和療法匹配起來,可以從整體上減少醫(yī)院在癌癥治療方法方面的大幅可變性,但是,在高度受控的臨床試驗(yàn)之外進(jìn)行的數(shù)據(jù)收集,可能無法帶來太多幫助。“如果沒有實(shí)驗(yàn)設(shè)計(jì),我們能從數(shù)據(jù)收集和整理中獲得多少東西?這是一個(gè)開放性的問題。”他說。

特納和扎克-溫伯格并沒有指望能讓懷疑者們很快轉(zhuǎn)變態(tài)度。但在Flatiron Health日益穩(wěn)定的客戶群中,有很多人和他們一樣,都相信該公司的“智能數(shù)據(jù)”方法可以為癌癥患者提供更好的治療機(jī)會(huì)。阿伯內(nèi)西說,除了其他裨益之外,F(xiàn)latiron Health還可以開個(gè)頭,在社區(qū)診所和頂尖學(xué)術(shù)醫(yī)院之間架起一座橋梁,彌合它們之間的鴻溝,這往往會(huì)帶來很好的效果。

聯(lián)合創(chuàng)始人溫伯格也表示,F(xiàn)latiron Health面對(duì)的是一場(chǎng)對(duì)抗癌癥的持久戰(zhàn)。 “我們的公司于兩年前創(chuàng)辦,擁有一個(gè)雄心勃勃的計(jì)劃。我們的起步相當(dāng)不錯(cuò),但終究來說,這個(gè)問題本身很難對(duì)付,人們已經(jīng)和它斗爭了數(shù)十年之久。”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)