第二部分 流行病風暴來襲 10 大數據時代的流行病預測

這是一座大城市,它遭受了重創。首批病例出現在8月下旬,患者痛苦不堪。最早的臨床癥狀是嚴重的腹瀉和嘔吐。患者們表現出重度脫水、心率加快、肌肉痙攣、煩躁不安、嚴重口渴、皮膚缺乏彈性等癥狀。一些患者病情發展為腎衰竭,其他的則發展為昏迷或者休克。很多染病的人都死了。

到了8月31日晚上,疫情真正暴發了。接下來的3天時間裡,僅一條街上就死了127人。到了9月10日,死亡數上升至500人。流行病來襲,童叟皆無倖免,鮮有無人患病的家庭。

這場流行病給市民帶來了極大的恐慌。在一星期時間內,街道里3/4的居民都逃走了。商店打烊,住戶家大門緊鎖。以前熙熙攘攘的城市街道,如今連個人影都看不見。

疫情之初,一位40歲的流行病學家開始對病源進行調查。他諮詢了社區領導,系統地對患者家庭進行了訪談,並在詳細繪製的地圖上標出每一個病例。他懷疑是一種水源性疾病在作祟,於是研究該社區的水源,斷定其水源來自兩家城市自來水公司中的一家。他從供水系統中取樣進行微生物和化學分析,沒得出明確結論。

在給負責人的報告里,他闡述了自己的分析,認為疫情應該是水污染所致。儘管水質分析沒有明確結果,但為病例所繪製的地圖強有力地支持其結論:一個特殊的出水口是疫情之源。他建議切斷水源,負責人同意了。雖然大批民眾逃離社區,使疫情可能有所減輕,但事實證明,調查研究和關閉水源對控制疫情還是至關重要的。

這次疫情的不尋常之處,不是暴發後的程序性調查。世界上各國的當代流行病學家會定期實施這樣的調查。他們得到當地領導的支持,研究病例的分布情況,對潛在的病源進行分析,並且經常跟官員就最佳應對舉措進行爭論。我要分享的這個案例的不尋常之處在於:疫情發生在1854年——在流行病學出現之前。

流行病大事記

1854年,倫敦爆發大規模霍亂疫情。經過研究,約翰·斯諾醫生髮現引發疫情的病源是水。

正如你可能已經猜到的那樣,負責調查疫情的正是約翰·斯諾(John Snow),著名的倫敦內科醫生和牧師,如今被視為當代流行病學的奠基人之一(見圖10-1)。引發疫情的罪魁禍首當然就是霍亂弧菌(vibrio cholerae),即霍亂。由於發現病源是水而不是「污濁的空氣」,斯諾為現代傳染性疾病的微生物理論做出了貢獻——該理論認為傳染病是由微生物引起的。直到今天,你都能在倫敦索霍區看到那個著名的百老匯街水泵的複製品。斯諾斷定那個水泵是1854年疫情之源。

今天看來斯諾有點憑直覺判斷,但他使用訪談、病例識別和繪製地圖的方法來找出1854年百老匯街霍亂疫情之源,在那個時代是具有革命性意義的。雖然1854年以前地圖已被廣泛使用,但他繪製的索霍區地圖無論在流行病學上,還是繪圖學上都屬創舉(見圖10-2)。他是第一位利用地圖從地理學角度分析相關事件,並由此得出因果結論的人。此舉使斯諾被譽為地理信息系統(geographic imformation system, 簡稱GIS)使用第一人。

地理信息系統

目前普遍使用的一種繪圖系統,用於捕捉和分析地理信息。

在當代地理信息系統中,一層層的信息添加到了像斯諾所繪製的地圖中,用於提供更有深度的地理信息,並提出因果關係的模式。雖然斯諾的地圖包括街道、住家、疾病和水源的位置,但現在的地圖會包括更多層面的信息:有在不同地點採集的霍亂樣本的基因信息,有結合天氣信息和空間變化的時間維度,也可能有來自不同家庭的個人之間的社會聯繫。

GIS是各種各樣當代研究技術中的一種。這些技術使我們調查疫情和了解疾病傳播的研究方式發生了明顯變化。全面協調使用這些技術手段,就可能從根本上改變我們監測和遏制疫情的方式。

我們現在擁有多種斯諾在19世紀中葉所缺乏的科技優勢。其中最重要的一點,是我們捕捉微生物和記錄其多樣性的能力已有了顯著提高。分子生物學的革新,尤其是捕獲基因信息並對其進行測序的技術革新,已經深刻地改變了我們識別周圍微生物的能力。

像聚合酶鏈反應(polymerase rea, 簡稱PCR)這樣奇妙的技術,現在已經成了標準的研究手段,該技術的發明者凱利·穆利斯(Kary Mullis)因此獲得了諾貝爾獎。PCR使我們能夠從微生物上截選微小的基因信息碎片,製作出數十億相同的拷貝,然後閱讀其基因序列,了解所屬的微生物家族。標準的PCR需要研究者知道自己正在尋找什麼。例如,如果我們想要找到一種未知瘧原蟲,我們可以用PCR去識別特定的瘧原蟲基因序列,因為所有瘧原蟲都有彼此看上去十分相似的基因區域。但是,如果我們不知道正在尋找的是什麼呢?

在21世紀初,為了找到未知微生物,一位聰明的年輕分子生物學家喬·德瑞斯(Joe DeRisi)和他的同仁們改進了一項令人關注的技術。該技術由他的博士生導師、斯坦福生物化學家派特·布朗(Pat Brown)開發。布朗發明的DNA微陣列晶元(DNA microarray chip),是在一個小玻璃片上以陣列形式分布的成千上萬個不同的、細小的人工合成基因序列。因為樣本基因信息與預設基因序列粘在一起,如果用藥液沖洗置於載玻片上、含有基因信息的樣本,那麼與載玻片上預設基因序列匹配的樣本基因將會溶解。這樣你就可以通過識別載玻片上哪些預設基因序列誘捕了其自然界的兄弟姐妹,來確定樣本里有些什麼基因序列。到德瑞斯改進該技術的時候,成千上萬的科學家們已經採用這一技術來描繪生命系統中基因信息的特徵。

在德瑞斯的創新性研究之前,微陣列晶元主要用於幫助科學家們確定人類基因和動物基因的內部運作方式。但德瑞斯及其同仁們意識到,如果將這項技術加以改進,就能夠創造出一個強大的病毒檢測系統。他們沒有將晶元設計成人工合成的人類基因信息陣列,而是設計成病毒基因信息陣列。通過仔細地梳理科學界所有已知病毒基因信息的科學數據,他們精心製作了晶元,上面以陣列形式排列著一個完整的病毒家族基因信息。如果他們從一位病患身上獲得基因信息,其中所包含的病毒的某個序列與晶元上的序列相似,那麼病毒就會被誘捕住。這就成功了!我們據此可以知道正在對付的是什麼病毒。

這些病毒微陣列(viral microarray)專用晶元在全世界的實驗室里得以廣泛地應用。它們有助於迅速地識別出導致新型流行病的微生物兇手,例如引起SARS的冠狀病毒,但是該技術並非完美無缺。這些晶元只能抓住來自科學界已知病毒家族的病毒。如果有一組我們完全不知道其序列的病毒,那麼我們就沒法在晶元中設計其基因序列,真正未知的病毒就會被我們忽略掉。

近幾年裡,一系列大膽新穎的測序方法,已經補充到病毒微陣列中。新機器從樣本中解讀出哺乳動物的大量基因序列數據——這些數據以前因價格昂貴或者耗時太長而無法拿到。這些機器正幫助我們確立一個全新的發現病毒的方法。

這個方法不是尋找特殊的基因信息,而是採集一個樣本,也就是一滴血,對其含有的每一個基因信息進行測序。技術上比我說的更為複雜,但結果與你所設想的差不多。能夠閱讀所提供的生物樣本的每一個基因序列,這正是我們一步步靠近的目標。到時候,我們將能夠閱讀來自宿主樣本的每一個DNA或者RNA信息,尤其關鍵的是,能夠閱讀追隨著它們而來的微生物的每一個基因信息。

中心問題之一就變成了生物信息學——如何對這些奇妙的研究技術所產生的幾十億個基因信息進行整理?幸運的是在一個啟蒙運動中,美國國家衛生研究院的科學家們對測序信息加以挑選,建成了一座電子倉庫。該電子倉庫由著名的美國洛薩拉莫斯國家實驗室(Los Alamos National Laboratory)研發,現在被叫作基因庫(GenBank)。因為研究資助機構和學術期刊要求科學家們在提交學術論文前先到基因庫提交基因序列,我們每年共為其貢獻幾十億個基因信息。基因庫目前有超過1000億個基因序列信息,並且其庫存數量增長很快。從一次基因測序中確認的一個新序列,能夠迅速地與基因庫內的序列進行電子比對,看是否有匹配的序列。

在2006年年末和2007年年初,科學家們使用這些技術手段取得了很好的成果。2006年12月上旬,澳大利亞但德隆醫院裡一位患者因腦溢血死亡,其器官被取下用於移植。一位63歲的老太太和另一個不知名的受體分別移植了他的兩個腎,當地一所大學一位64歲的講師移植了這位男子的肝臟。到了20

上一章目錄+書簽下一頁