借助開源機器學(xué)習激起群眾抗擊癌癥
這是偷竊的公開邀請。它面向癌癥工作者,并通過一個新程序吸引他們,該 程序 通過機器學(xué)習和原始遺傳數(shù)據(jù)預(yù)測癌癥藥物的有效性。在佐治亞理工學(xué)院構(gòu)建該程序的研究人員希望癌癥工作者免費獲得該程序,甚至只是輕掃其編程代碼的一部分,因此他們將其開源。他們希望吸引大量研究人員,他們也將分享自己的癌癥以及計算機專業(yè)知識和數(shù)據(jù),以改善該程序并共同挽救更多生命。
研究人員邀請他們采用自己的密碼也是項艱巨的任務(wù)。
他們正在挑戰(zhàn)別人,在自己的游戲中擊敗他們,并幫助磨練強大的軟件工具,以實現(xiàn)更大的利益。不僅勞動,而且水果也將保持公開可用,以使患者得到最好的治療。
佐治亞理工大學(xué)綜合癌癥研究中心主任約翰·麥克唐納說:“我們不想自己保留代碼或數(shù)據(jù),也不會因此牟取暴利 。” “我們希望保持這種開放狀態(tài),以使其擴散。”
希望參與的研究人員可以通過 此鏈接訪問2017年10月26日發(fā)表在《PLOS One》雜志上的一項新研究 。他們在那里會找到從GitHub下載軟件并訪問代碼的鏈接。
他們將從當前的程序開始,該程序在273個癌癥患者的遺傳數(shù)據(jù)中評估9種藥物的治療有效性時,準確率約為85%。麥當勞和合作者弗雷德里克·范伯格(Fredrik Vannberg)所做的研究詳細說明了如何以及為什么。
佐治亞理工學(xué)院生物科學(xué)學(xué)院的助理教授范伯格說:“已發(fā)表的研究中有9種藥物,但實際上我們總共通過該計劃運行了約120種藥物 。”
該程序使用行之有效的機器學(xué)習機制,并對數(shù)據(jù)進行規(guī)范化。后者允許機器學(xué)習通過使其兼容來處理來自不同來源的數(shù)據(jù)。
研究人員減少了人們對哪些數(shù)據(jù)對于預(yù)測結(jié)果至關(guān)重要的偏見。
麥當勞說:“放入大量原始數(shù)據(jù)并讓算法對其進行分類要有效得多。” “它是在尋找相關(guān)性,而不是原因,因此,預(yù)先選擇您認為最相關(guān)的數(shù)據(jù)是不好的。”
研究人員拋棄的一大偏見是,只專注于與他們要治療的特定癌癥類型有關(guān)的基因表達數(shù)據(jù)。
Vannberg說:“事實最好是提供來自多種癌癥的程序數(shù)據(jù),而實際上,這將在以后更好地預(yù)測特定癌癥(如乳腺癌)的藥效。”
麥克唐納說:“例如,從分子水平上講,某些乳腺癌與某些卵巢癌相比將與其他乳腺癌更為相似。” “我們只是讓該算法可以處理我們擁有的所有東西,而且我們獲得了很高的準確性。”
獲獎?wù)?/p>
研究人員還希望該項目匯集大量匿名患者治療的成功和失敗數(shù)據(jù),這將有助于該計劃優(yōu)化預(yù)測,以使每個人受益。但這并不意味著有些公司也不能從中受益。
佐治亞理工大學(xué)生物科學(xué)學(xué)院的教授麥克唐納說:“如果一家公司在使用該程序幫助患者的過程中出現(xiàn)并賺錢,那很好,并且沒有義務(wù)回饋該項目 。” “如果其他人愿意的話,他們可能會選擇。”
但希望大多數(shù)玩家會抓住善良的精神。
Vannberg說:“在我們的項目中,我們正在宣傳共享應(yīng)該是每個人都要做的事情。” “這對每個人來說都是一個勝利,但對癌癥患者來說,這確實是一個勝利。”
標簽: 抗擊癌癥