伊莉討論區

標題: 哈佛大學本科生的AI模型有助於預測結核病耐藥性 [打印本頁]

作者: lonelong 時間: 2019-5-6 09:48 PM 標題: 哈佛大學本科生的AI模型有助於預測結核病耐藥性

[attach]127229632[/attach]

根據世界衛生組織（WHO）的數據，治療結核病是世界上最大的傳染性殺手之一，最大的挑戰之一就是細菌迅速變形並對多種藥物產生抗藥性的能力。快速鑑定抗性菌株並選擇合適的抗生素來治療它們仍然很困難，原因有幾個，包括細菌在實驗室中緩慢生長的傾向，這可能會使藥敏試驗結果在初診後6週內延遲。

在患者開始治療之前，迫切需要能夠快速可靠地檢測對最常用藥物的耐藥性的新測試，以改善結果並幫助抑制感染的傳播。

現在，哈佛大學應用數學學生Michael Chen '20，與哈佛醫學院Blavatnik研究所的生物醫學研究人員合作，設計了一個計算機程序，為這些測試的開發奠定了基礎。

該計劃於4月29日在EBioMedicine中描述，能夠在十分之一秒內準確預測TB菌株對10種一線和二線藥物的耐藥性，並且比同類藥物具有更高的精確度。

如果納入臨床試驗，該模型可以更快，更準確地進行電阻檢測，克服當前電阻測試方法的缺陷，這些方法要麼花費太長時間才能產生確定的結果，要麼不可靠。

“耐藥形式的結核病難以發現，難以治療，並預示患者的預後不良，”高級研究作者，哈佛醫學院生物醫學信息學助理教授，馬薩諸塞州綜合醫院肺科醫學專家Maha Farhat說。 “在診斷時快速檢測出完整的耐藥性的能力對於改善個體患者的預後和減少感染對他人的傳播至關重要。”

新模型將很快在線提供，作為哈佛醫學院genTB工具的一項附加功能，該工具可分析結核病數據並預測結核病耐藥性。

據世界衛生組織稱，全世界每年診斷出的結核病新病例超過1000萬例。在這些新感染中，4％對至少兩種藥物有抗藥性 - 這種疾病稱為多藥耐藥結核病或耐多藥結核病。在耐藥性感染中，十分之一的患者俱有廣泛的耐藥性，或廣泛耐藥結核病，並且對多種藥物表現出很強的抵抗力。一旦感染確定就給予一線藥物，如果患者出現耐藥症狀或測試顯示細菌菌株不受一線治療的影響，則加入二線治療。

不完美的測試

在發展中國家，藥物敏感性測試很難獲得，許多被診斷患有結核病的人在經驗上接受治療，基於僅僅是受過教育的臨床猜測和假設。

不到一半的耐多藥結核病感染率較高的國家具有現代診斷能力。即使在設備最完善的實驗室中，傳統的，基於培養的藥物敏感性測試需要數週或數月才能報告結果，因為結核菌在培養皿中往往生長緩慢，實驗室工作人員面臨的實際感染風險很小但實際感染風險更大誰處理結核病樣本。

越來越多地使用新的分子測試來掃描TB樣本的DNA以獲得抗性基因，但是它們有其自身的局限性 - 最重要的是它們僅檢測到對多達四種藥物的抗性，而且不可靠。他們也無法檢測到導致抗藥性的罕見遺傳變異體的存在。

檢測所有賦予抗性的突變的最佳方法是對細菌的全基因組進行分析。研究人員稱，基於全基因組測序數據有幾項藥物敏感性測試，雖然它們檢測出對所有一線藥物的耐藥性，但它們對二線藥物的耐藥性檢測往往表現不佳。

這些測試還傾向於以簡單的二元方式對突變進行分類 - 或者是否賦予抗藥性 - 這使得它們在含有罕見突變或未知顯著突變的菌株中具有不可靠的抗藥性檢測器。使用全基因組數據的當前模型的另一個關鍵盲點是它們無法評估各種基因和基因突變之間的相互作用;換句話說，一種基因或一種基因變體的存在如何影響另一種基因的功能，這種現象稱為上位性。新模型克服了這個缺陷。

超越簡單的檢測

為了解決這一挑戰，科學家著手製定一個能夠捕捉多種突變的協同效應的計劃。他們設計並測試了五種計算模型，其中兩種計算模型的準確性非常突出。一種是基於邏輯回歸分析形式的統計模型，這是一種評估一個變量對另一個變量的影響的方法。另一種是神經網絡方法，它結合了兩種分析範圍的學習和深度學習模式。該模型的廣泛學習部分類似於統計模型，其中每個突變被編碼為賦予抗性或不賦予抗性的變量。深度學習部分包含隱藏層，評估多個基因和多個突變的交互作用。結果是一個模型，其行為或多或少地作為診斷工具，而不是根據先前知識評估所有可用信息以確定阻力。

“我們的目標是開發一種神經網絡模型，它是一種機器學習類型，與鬆散地類似於大腦中神經元之間的聯繫，”陳說，他開始編寫該程序作為第一年，現在是一名大三學生攻讀計算機科學副學士學位的應用數學學位。該研究的第一作者，他計劃去醫學院。

“廣泛而深入的神經網絡交織兩種形式的機器學習，以確定遺傳變異對抗生素抗性的綜合影響，”陳說。

邏輯回歸模型和廣泛深度學習模型的表現相當，但由於其能夠分析多個突變的綜合影響，因此廣泛和深度模型在預測對幾種二線療法的抵抗方面具有輕微優勢。菌株的抗性，以及非常罕見的基因突變的影響，其意義很小或未知。研究小組表示，後一種特徵使得廣泛和深度學習模型在預測中比以前的模型更準確，即使在含有罕見基因突變的樣本中也能夠捕獲抗性，這些基因突變對藥物敏感性的影響尚不清楚。相比之下，先前開發的機器學習平台依賴於發現已知會引起抗性的常見基因突變。

“廣泛而深入的模型是一種決策工具，它將所有數據與先前的生物學知識相結合，即抵抗力是由大量個體突變和許多不同突變之間的相互作用引起的，”研究共同資深作者Andy Beam說。，HMS的生物醫學信息學教員和哈佛大學的客座講師陳公共衛生學院。

素質教育

是什麼讓模特成功？研究人員相信程序被“訓練”的數據的豐富性。這些模型不是學習已知會促進抵抗的一組預定義的常見基因突變，而是接觸到一個數據集，其中包括各種基因插入和缺失的基因突變，極少數變異只出現在少數基因中。分離株甚至一個分離株。

對3,601個對一線和二線藥物具有抗性的TB菌株進行了模型培訓，其中包括1,228種多藥耐藥菌株。該數據集包括藥物敏感性測試的結果，允許該模型評估某些突變的存在與藥物敏感性之間的聯繫。培訓集是由關鍵路徑研究所的研究人員策劃的各國數據生成的，得到了比爾和梅林達蓋茨基金會的支持。

為了在真實環境中測試它們的性能，模型被要求預測一組792個完全測序的TB基因組中的抗性，這些基因組之前從未“見過”。這創造了一種高保真測試場景，消除了模型遇到他們在訓練期間“研究”的熟悉應變的可能性。

廣泛和深入的神經網絡模型預測對一線藥物的耐藥性，平均準確度為94％，對二線藥物的準確度為90％。統計模型預測阻力分別為94％和88％。廣泛和深入的神經網絡模型在預測對三種特定藥物的抗性方面表現出稍高的準確性。

這兩種模型都能夠在十分之一秒內預測對一線和二線治療的抵抗力，強調了人工智能和大數據在疾病治療的快速檢測和選擇中將發揮越來越重要的作用。

“我們的模型強調了人工智能在結核病中的作用，但其重要性遠遠超過了結核病，”Beam說。 “AI將通過快速合成大量數據來幫助指導臨床決策，以幫助臨床醫生在許多情況下和許多其他疾病中做出最明智的決策。”

歡迎光臨伊莉討論區 (http://a401.file-static.com/)