二十幾個電腦專家,一大筆來自谷歌的投資,一個由來已久卻又讓人最為頭疼的難題……這個故事的劇情發(fā)展你也許已經(jīng)可以猜到:幾個天才少年在精英大學(xué)相遇,因為對電腦的熱愛迅速成為朋友。在經(jīng)過幾次深夜會議的謀劃之后,他們建立起了一個網(wǎng)站或者一個應(yīng)用程序。不知不覺,他們這個小小的“副業(yè)”項目就變成了一家初創(chuàng)公司,而這幾個稚氣未脫的年輕人也從投資人手里拿到了大把的風投,一夜暴富。
第一眼看上去,奈特·特納(Nat Turner)和扎克·溫伯格(Zach Weinberg)很符合上面那個故事情節(jié)中主人公的氣質(zhì)。作為賓夕法尼亞大學(xué)的新生,他們兩個在入學(xué)的第一天一見如故,成為了最好的朋友。如今,這兩位28歲的年輕人在紐約經(jīng)營著一家創(chuàng)業(yè)公司。不過與眾不同的是,他們公司的夢想比其他人都要宏大。這個處于發(fā)育期的科技公司沒有從事傳統(tǒng)的社交網(wǎng)絡(luò)行業(yè),也不開發(fā)照片分享類應(yīng)用和約會網(wǎng)站,更不涉足夜宵外賣業(yè)務(wù)。那他們的業(yè)務(wù)領(lǐng)域究竟是什么?
Flatiron Health創(chuàng)立于兩年前,有著一個富有冒險精神的企業(yè)目標:震撼醫(yī)療健康世界。他們不是什么醫(yī)療健康問題都關(guān)注:特納和溫伯格希望能收集分析巨量的臨床數(shù)據(jù)從而為解決癌癥治療提供幫助。眾所周知,癌癥問題一直是醫(yī)學(xué)界最為復(fù)雜、困難,也最為依靠科研的一個領(lǐng)域。生物學(xué)院的學(xué)生花了大把時間研究癌癥卻一直沒有成果,這對來自沃頓商學(xué)院(主要學(xué)習經(jīng)濟學(xué)和企業(yè)管理)的創(chuàng)始人能否有所建樹?
在你質(zhì)疑和嘲笑之前,先看看他們的履歷。Flatiron Health并不是他們的第一家公司,而是第三家。他們曾經(jīng)嘗試過為大學(xué)生提供在線訂餐業(yè)務(wù),但是沒有成功。之后他們又在大三的時候創(chuàng)建了Invite Media,試圖利用大數(shù)據(jù)技術(shù)提高數(shù)字營銷的銷效率。這一次他們大獲成功,谷歌在2010年決定以超過8000萬美元的價格將其收購。
現(xiàn)在谷歌又一次掏出了支票本,以旗下風險投資公司谷歌創(chuàng)投的名義向Flatiron Health注資1億美元(該公司總計獲得投資1.38億美元)。除了谷歌之外,這兩個年輕人還打動了艾米·阿伯內(nèi)西。艾米是杜克大學(xué)的醫(yī)學(xué)教授,也是著名的腫瘤專家。她了解了Flatiron Health極其與眾不同的企業(yè)目標,并被兩位創(chuàng)始人周密系統(tǒng)的臨床數(shù)據(jù)收集和組織辦法所打動。去年七月,艾米正式?jīng)Q定加入公司,擔任首席醫(yī)學(xué)官。在此之前艾米一直負責杜克癌癥治療研究項目,她表示:“加入Flatiron Health可是堵上了我的名譽。
除去谷歌的大筆投資和業(yè)內(nèi)人士的推薦,光是Flatiron Health稍顯狂妄的目標也的確令人矚目。要知道,此前有大批科學(xué)家和受過良好訓(xùn)練的醫(yī)生從事癌癥研究工作,僅憑兩個稚氣未脫的工程師能取得超越他們的成果嗎?Flatiron Health的CEO特納是一個謙遜卻又勇敢的人,他表示:“我們的公司只是恰好建立在癌癥領(lǐng)域之中而已。”
Flatiron Health的想法很簡單?,F(xiàn)在,只有一小部分癌癥病人的治療數(shù)據(jù)被系統(tǒng)地收集起來。而這些經(jīng)過收集的數(shù)據(jù)一般來自隨機的臨床治療案例,僅僅占到了成年癌癥病人總數(shù)的4%左右。Flatiron Health認為,系統(tǒng)化、標準化地收集剩下96%病人的治療情況數(shù)據(jù)并將數(shù)據(jù)反饋給醫(yī)生,這樣就能夠幫助醫(yī)生提出更好的治療方案。
理論上來說,醫(yī)生能從數(shù)據(jù)中看出相同情況下哪種治療方法在大部分病人身上效果最好。比如,醫(yī)生可以將自己的治療方案同全國范圍內(nèi)其他醫(yī)生的方案進行對比,然后修正自己的不足之處。數(shù)據(jù)同樣能幫助我們提高治療方案的性價比,減少浪費醫(yī)療健康支出的情況。另外,數(shù)據(jù)能幫助更多病人匹配找到適合自己的臨床試驗,這也許能加快新藥品的研發(fā)和審批進度。特納和溫伯格并不是叫賣著“通過數(shù)據(jù)終結(jié)癌癥”這種烏托邦式的白日夢,他們希望能夠取得更有意義的成果。特納說:“我們所做的一切都是想像其他行業(yè)學(xué)習,充分利用數(shù)據(jù)中蘊含的價值。至于這個價值有多大,我們還不清楚。”不過即便他們僅僅取得了一點收獲,也能影響上百萬人的生活。 2014年,美國新增癌癥患者接近1700萬。如果大數(shù)據(jù)能幫助我們提升5%的生存率,那意味著能在2014年一年就拯救成千上萬條性命。
特納的父親是一位地球物理學(xué)家,從事石油勘探工作。特納從小先后在德克薩斯州、路易斯安那州、荷蘭和蘇格蘭生活過,同事稱這位年輕人輕快舒適的微笑之下隱藏著一個“成熟的靈魂”。現(xiàn)在,特納淺棕色的頭發(fā)開始慢慢變得稀少,這使得他寬大的前額暴露出來。即便如此,對于一個剛畢業(yè)的學(xué)生來說他的長相還是很顯年輕。特納不像成功的創(chuàng)業(yè)人士那樣趾高氣昂,也不像那些相信自己可以改變世界的發(fā)明家一樣專橫,他認為Flatiron Health的發(fā)展計劃是腳踏實地的。他和成長于曼哈頓上西區(qū)的溫伯格一樣,堅定地認為技術(shù)能改變癌癥患者的生活。溫伯格說:“如果你了解醫(yī)療健康和腫瘤領(lǐng)域,你會發(fā)現(xiàn)這里面有大量的問題亟待解決。一個謙虛的團隊找到正確的方向,他們就能為解決困難提供幫助。”
特納從2009年起開始對癌癥感興趣。在全家前往北加州度假期間,他7歲的堂弟西姆金斯突發(fā)疾病。經(jīng)過一系列檢查之后,醫(yī)生確診他患上了白血病。在接下來的幾年中,這個孩子經(jīng)歷了一系列折磨:骨髓移植,疾病復(fù)發(fā),再次骨髓移植,癌癥又一次復(fù)發(fā)??傊髂方鹚骨扒昂蠛蠼?jīng)歷了4次骨髓移植和很多誤診。自從2011年起,這個小家伙狀況穩(wěn)定,現(xiàn)在已經(jīng)12歲了。
西姆金斯的慘痛經(jīng)歷使得特納和溫伯格開始思考,他們試圖尋找一種能幫助境況相似的其他人的解決方案。當考慮建立新公司時,他們首先想到的是一個通過互聯(lián)網(wǎng)提供第二意見(second-opinion)服務(wù)的公司。特納介紹說,他們在半年之后才決定全力專注于癌癥領(lǐng)域。之后,這兩位創(chuàng)始人同克里希那·葉斯萬特(醫(yī)生、谷歌創(chuàng)投合伙人之一)一起參觀了60多個癌癥中心,同大量專家、醫(yī)生進行交流,并多次討論可行的商業(yè)理念。
在大量的會議和討論之后,特納和溫伯格形成了一個新的想法:系統(tǒng)化收集現(xiàn)在散落于全國腫瘤治療中心文件系統(tǒng)中的臨床數(shù)據(jù)。他們建議收集所有數(shù)據(jù)(電子版和其他版本都要),然后對其整理、匯聚之后再反饋給醫(yī)生,以此達到幫助醫(yī)生形成更好的醫(yī)療方案的目標。
對于向特納和溫伯格這樣的數(shù)據(jù)極客而言,他們面臨的問題是顯而易見且并不陌生的:雖然醫(yī)療機構(gòu)一直勸說醫(yī)生和醫(yī)院使用電子病歷,但是想要獲取和使用腫瘤數(shù)據(jù)依舊非常困難。特納說:“電子病歷數(shù)據(jù)糟透了。”一個病人的數(shù)據(jù)可能來自很多個來源:內(nèi)科醫(yī)生、腫瘤專家、放射科醫(yī)生、外科醫(yī)生、實驗室報告和病理學(xué)報告等等。即便醫(yī)院完成了病歷的數(shù)字化,他們也常常以技術(shù)人員稱之為“非結(jié)構(gòu)化格式”儲存數(shù)據(jù)。而且,各個數(shù)據(jù)來源數(shù)據(jù)非但沒有整齊地將數(shù)據(jù)整理在數(shù)據(jù)庫中,反而各行其道。這就導(dǎo)致不同的實驗室報告和記錄對數(shù)據(jù)有著不同的記錄方式。更糟糕的是,特納和溫伯格還要應(yīng)對很多手寫和掃描的病例報告、無人聆聽的錄音和傳真機傳真來的低分辨率PDF文件,而所有這些文件中都隱藏了大量的數(shù)據(jù)信息。最后,大量不兼容的系統(tǒng)和政府對私人健康信息的嚴格監(jiān)管也是一大障礙,使得分享成千上萬腫瘤治療數(shù)據(jù)難上加難。
坦率地說,F(xiàn)latiron Health要面對的挑戰(zhàn)是巨大的。
理論上說,電子病歷的存在會簡化數(shù)據(jù)匯集和整合的工作,但事實卻不盡如人意:對于癌癥患者,我們通常要檢測他們體內(nèi)某種蛋白質(zhì)(比如白蛋白)的水平。不同癌癥診所會以不同的方式在電子病歷中記錄檢測數(shù)據(jù),格式可以多達30余種。要知道,對于癌癥病人的蛋白和基因檢測、組織切片和其他病例監(jiān)測總計多達100余種,而全美又有無數(shù)個不同的電子病歷系統(tǒng)和癌癥中心。這樣一來,數(shù)據(jù)的差異性簡直讓人眼花繚亂,而這也大大增加了數(shù)據(jù)收集、匯聚和整合的難度。
對于癌癥病人通常接受的超過100種血液、基因、切片組織檢查,F(xiàn)latiron Health適用了同樣的辦法分析數(shù)據(jù)。同時,他們還不斷更新自己的系統(tǒng)以便能夠處理最新研發(fā)出來的新型檢測帶來的數(shù)據(jù)。
為了開始處理數(shù)據(jù),特納和溫伯格花了兩年多構(gòu)建他們稱之為數(shù)據(jù)模型的東西。通過數(shù)據(jù)模式,他們能將雜亂的臨床數(shù)據(jù)進行分類整理。之后,他們很快認識到如果要對所有類型的癌癥都進行這樣的數(shù)據(jù)整理分類工作,那他們將要面臨極為復(fù)雜的工作。因此,在同一個醫(yī)生顧問團隊開展合作之后,特納和溫伯格開始專攻結(jié)腸癌。通過分析已經(jīng)公開的臨床試驗,他們整理出了超過350種數(shù)據(jù)類型。這些數(shù)據(jù)包羅萬象,包括了癌癥階段的人口統(tǒng)計和分布、疾病的生物學(xué)標記、患者對療法的反應(yīng)等。有了經(jīng)驗之后,他們又對其他幾種癌癥進行了數(shù)據(jù)分析整理。
從電子病歷中提取數(shù)據(jù)是一件極其消耗人工的事情。為了能夠?qū)⑦@一過程自動化,F(xiàn)latiron Health采用了多種電腦技術(shù),包括使用旨在精確定位實驗室報告中有價值數(shù)據(jù)的匹配算法。同時,他們還對自然語言處理技術(shù)進行了調(diào)整,從而使電腦能“閱讀”文件并從中提取數(shù)據(jù)。眾所周知,這些電腦技術(shù)有可能出現(xiàn)誤差,因此Flatiron Health研發(fā)了混合型人機學(xué)習系統(tǒng),從而發(fā)現(xiàn)并糾正錯誤。另外,該公司還雇傭了50個護士,安排他們手動輸入500名病人的數(shù)據(jù)。這一批數(shù)據(jù)就構(gòu)成了特納所謂的“訓(xùn)練集”,可以幫助系統(tǒng)發(fā)現(xiàn)自動化數(shù)據(jù)收集過程中的錯誤。發(fā)現(xiàn)問題之后,算法會將這些差異反饋給系統(tǒng),從而優(yōu)化完善自動化收集過程。隨著收集過程不斷發(fā)展,這個動態(tài)系統(tǒng)理論上能夠不斷提高自己的準確度。
Flatiron Health不是第一個著手從事癌癥數(shù)據(jù)處理的公司。去年美國臨床腫瘤協(xié)會(非營利性專業(yè)組織)宣布,將開發(fā)CancerLinQ系統(tǒng)以完善臨床數(shù)據(jù)庫,從而改善護理質(zhì)量并提升藥物研發(fā)速度。Cancer Commons是經(jīng)驗豐富的計算機科學(xué)家馬蒂·泰拉貝爾運營的一個非營利組織,他們希望能夠幫助相關(guān)人士對腫瘤臨床數(shù)據(jù)進一步進行標準化處理,從而使其以一種格式出現(xiàn)并能被所有人自由使用。IBM則通過自己的沃特森(Watson)人工智能系統(tǒng)同Memorial Sloan Kettering這樣的腫瘤中心開展了合作,從大量期刊論文和臨床試驗報告的臨床數(shù)據(jù)和文本,然后將結(jié)果和推薦治療方案自動提供給醫(yī)生,以便他們更好地治療病人。
這些之前的努力(包括美國國家癌癥研究所一個名為caBIG的耗資5億美元的生物信息項目)要么以慘痛的失敗結(jié)束,要么尚未取得令人滿意的結(jié)果。杜克大學(xué)的阿伯內(nèi)西教授曾經(jīng)在CancerLinQ項目的咨詢委員會擔任負責人,此前也曾涉足過其他類型對臨床腫瘤數(shù)據(jù)進行數(shù)字化編譯的項目。她表示自己被Flatiron Health對于數(shù)據(jù)復(fù)雜度的專注打動。“特納和溫伯格清楚地知道,僅僅以技術(shù)手段解決這個問題不可能成功??吹搅诉@點,我才決定加入團隊。”
谷歌創(chuàng)投的投資不僅僅提高了Flatiron Health的可信度,也使得該公司有了收購Altos Solutions(該公司為腫瘤臨床實踐提供電子病歷服務(wù))的可能。此次收購使得Flatiron Health有了更大的客戶群,也讓他們同醫(yī)生的聯(lián)系更加緊密。目前,有大約210家癌癥中心使用了Flatiron Health的系統(tǒng),這些中心每年總計新增病人大約30萬。雖然大部分客戶是社區(qū)腫瘤診所,但是類似耶魯大學(xué)的Smilow癌癥醫(yī)院和賓夕法尼亞大學(xué)的Abramson癌癥中心也加入了進來。谷歌表示,自己的投資一定程度上加速了這個前途似錦領(lǐng)域產(chǎn)出成果。谷歌創(chuàng)投負責人比爾·瑪麗斯說:“原本只有當下一代人普遍使用電子病歷時,數(shù)據(jù)才能發(fā)揮作用。但我們不想這樣。我們希望能夠拯救那些現(xiàn)在就處于痛苦和煎熬中的患者。”
杰弗里·范瑟爾卡醫(yī)生支持Flatiron Health的理念,也非??春盟麄兊那熬?。他表示自己已經(jīng)使用Altos電子病歷系統(tǒng)多年,而這個系統(tǒng)幫助他提升了護理的質(zhì)量。不過,該系統(tǒng)的大部分潛力仍然有待開發(fā)。他說:“外面有大量的數(shù)據(jù),但是沒人能對其進行分類整理,也沒人知道這些數(shù)據(jù)表達的意思。這就是我覺得Flatiron Health很重要的原因。在收集百萬病人的分子數(shù)據(jù)和治療結(jié)果后,他們會評估、分類,然后分析出哪種治療方案真正有效果。”杰弗里醫(yī)生認為Flatiron Health的系統(tǒng)是“癌癥治療護理所需要的基礎(chǔ)設(shè)施”。通過該系統(tǒng),他能夠知道自己治療特定種類癌癥的醫(yī)療方案已經(jīng)落后,并隨即做出調(diào)整改進。同樣,他還能知道是不是有更多病人符合臨床試驗的條件。“如果你能以五倍的速度更快的積累病人,那么想想你能從監(jiān)管過程中獲得多少新的藥品。”他補充道。
癌癥治療是一個長期的過程,因此有些醫(yī)學(xué)專業(yè)知名人士對大數(shù)據(jù)的效果有所懷疑。開創(chuàng)型研究人員羅伯特·溫伯格(與扎克·溫伯格沒有親戚關(guān)系)在近期于《Cell》雜志上發(fā)表的論文中強調(diào),大數(shù)據(jù)與癌癥之間有著復(fù)雜多變的關(guān)系。作為麻省理工學(xué)院懷特海德生物醫(yī)學(xué)研究所創(chuàng)始人之一,羅伯特指出數(shù)據(jù)爆炸對所有問題都有影響,從蛋白質(zhì)之間的互動到腫瘤中的基因突變都會受到波及。因此,數(shù)據(jù)的爆炸程度已經(jīng)超過了研究人員能夠解釋說明的能力。“有些人被生物信息學(xué)所吸引??墒菍ξ叶裕虾蟮臄?shù)據(jù)能幫助人們以之前不能有的能力洞察癌癥性質(zhì)這樣的理念并不具有太多吸引力。”
羅伯特補充稱,即便數(shù)據(jù)能幫我們精確地改善某種治療方案的效果,其帶來的結(jié)果也不會顯著到足以讓醫(yī)生改變治療實踐的地步。“人們進行了很多勇敢的嘗試,也提出了很多樂觀的主張。相較于我們投入的努力,大數(shù)據(jù)給我們的產(chǎn)出的確太少了。”
約翰·約安尼季斯是斯坦福大學(xué)醫(yī)學(xué)和健康研究及政策學(xué)教授,他對于大數(shù)據(jù)的看法稍微樂觀一點。他認為,通過集中式系統(tǒng)將病人資料同臨床治療匹配能幫助我們降低醫(yī)院和診所中癌癥治療的可變性。不過,約安尼季斯教授對于來自高度臨床對照試驗數(shù)據(jù)之外的數(shù)據(jù)能給我們帶來大的進步和發(fā)展這一觀點存在質(zhì)疑。“大量匯集臨床實驗設(shè)計之外的數(shù)據(jù),這樣做能給我們帶來多少有用的成果還是一個有待觀察的問題。”他說。
特納和溫伯格并沒有期望能很快打消人們的懷疑。不過他們和公司不斷增加的客戶相信,“智能數(shù)據(jù)”這種方式能為癌癥病人提供更好的治療方案。阿伯內(nèi)西教授說,除了其他方面優(yōu)點之外,大數(shù)據(jù)首先就能消除社區(qū)診所和頂級研究型醫(yī)院之間護理可獲得性之間的差距。而這往往能帶來更好的結(jié)果。溫伯格也說,F(xiàn)latiron Health和癌癥的斗爭是一個長久性的過程。“我們是一個擁有雄心和偉大計劃的僅僅兩歲的創(chuàng)業(yè)公司。我們的第一步走得很好,不過我們面臨的根本上而言還是一個要持續(xù)數(shù)十年的問題。”