可視化大批生物數(shù)據(jù)的新方法
在細胞水平上研究遺傳物質(zhì),例如單細胞RNA測序,可以為科學家提供工作中生物過程的詳細,高分辨率視圖。這種詳細程度有助于科學家確定組織和器官的健康狀況,并更好地了解影響數(shù)百萬人口的疾病如阿爾茨海默氏病的發(fā)展。但是,還會生成大量數(shù)據(jù),因此需要一種有效且易于使用的方法來對其進行分析。
現(xiàn)在,來自密蘇里大學和俄亥俄州立大學的工程師和科學家團隊創(chuàng)建了一種新方法,可以使用稱為“機器學習”的計算機方法來分析單細胞RNA測序中的數(shù)據(jù)。這種方法利用計算機的功能來智能地分析大量數(shù)據(jù),并幫助科學家得出更快的結論并進入下一階段的研究。Nature Communications發(fā)表的一篇新論文詳細介紹了它們的方法。
MU工程學院教授Dong Xu說:“單細胞遺傳圖譜技術是當今技術進步的最前沿,因為它可以測量存在的基因數(shù)量以及如何從單個生物細胞的水平表達它們。” “至少以這種方式可以分析成千上萬個細胞,因此最終會收集到大量數(shù)據(jù)。目前,從這類數(shù)據(jù)中得出結論可能是具有挑戰(zhàn)性的,因為必須要處理大量數(shù)據(jù)。篩選通過以找到研究人員正在尋找的東西。因此,我們應用了一種最新的機器學習方法來解決這個問題-圖形神經(jīng)網(wǎng)絡。”
在計算機通過機器學習過程智能地分析數(shù)據(jù)之后,圖神經(jīng)網(wǎng)絡將獲取結果并創(chuàng)建數(shù)據(jù)的可視表示形式,以幫助輕松識別模式。該圖由點組成(每個點代表一個單元格),并且相似類型的單元格采用顏色編碼,以便于識別。徐說,精密醫(yī)學是如何使用單細胞RNA測序的一個很好的例子。
“利用這些數(shù)據(jù),科學家們可以研究癌組織的微環(huán)境中細胞之間的相互作用,或者觀察T細胞,B細胞和免疫細胞都試圖攻擊癌細胞,” Xu說。“因此,在一個人擁有強大的免疫系統(tǒng)并且癌癥尚未完全發(fā)展的情況下,我們可以學習如何在早期階段殺死癌癥,并且由于機器學習,我們可以更快地獲得結果,從而使我們能夠更快地進行可行的治療。”
許認為,這是工程師和生物學家如何共同研究生物學問題的一個很好的例子。他希望生物學家可以將此方法用作解決復雜生物學問題(例如可能治療阿爾茨海默氏病)的新工具。
標簽: 大批生物數(shù)據(jù)