融合新舊學(xué)派機(jī)器學(xué)習(xí)與傳統(tǒng)科學(xué)原理相結(jié)合
機(jī)器學(xué)習(xí)來得正是時(shí)候。世界現(xiàn)在充斥著比以往任何時(shí)候都多的數(shù)據(jù),并且可以在執(zhí)行數(shù)據(jù)分析時(shí)學(xué)習(xí)和改進(jìn)的計(jì)算機(jī)算法有望幫助科學(xué)家處理這種信息過載。
然而,誰認(rèn)為機(jī)器學(xué)習(xí)本身可以幫助解決在科學(xué),工程,醫(yī)學(xué)等復(fù)雜的問題,要爭取一個(gè)更加平衡的方法研究人員說, 羅馬格里戈里耶夫,一個(gè)部分 物理學(xué)院 隊(duì)與新 的研究 提示了進(jìn)行混合的方法融合了新時(shí)代技術(shù)、老派實(shí)驗(yàn)和理論分析的科學(xué)。該研究建議更快地解決復(fù)雜的、數(shù)據(jù)密集型的謎題,這些謎題涉及癌癥、地震、天氣預(yù)報(bào)和氣候變化等問題。
“這是現(xiàn)有理論理解以及實(shí)驗(yàn)數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合,”動(dòng)力學(xué)和控制組的物理學(xué)教授兼首席研究員格里戈里耶夫說 。“通常從事機(jī)器學(xué)習(xí)的人會(huì)忘記理論理解,幾乎完全依賴數(shù)據(jù)。這相對簡單,但是當(dāng)數(shù)據(jù)很多而數(shù)據(jù)中沒有足夠的結(jié)構(gòu)時(shí),這種方法必然會(huì)失敗。” Grigoriev 解釋說,通常有太多數(shù)據(jù)需要進(jìn)行有意義的分析,此時(shí)“問題變得棘手。從本質(zhì)上講,利用適當(dāng)?shù)念I(lǐng)域知識(shí)對于在數(shù)據(jù)中找到結(jié)構(gòu)至關(guān)重要。”
高維數(shù)據(jù)的問題
機(jī)器學(xué)習(xí)使用計(jì)算機(jī)算法來查找數(shù)據(jù)中的模式,但“大多數(shù)流行的機(jī)器學(xué)習(xí)方法以難以解釋和解釋的形式呈現(xiàn)結(jié)果,”格里戈里耶夫說。“除非你了解如何以及為什么你不能真正說你了解一個(gè)問題。”
理解和預(yù)測復(fù)雜的行為——通過處理大量密集、豐富的數(shù)據(jù)——可以幫助解決科學(xué)領(lǐng)域的基本和實(shí)際問題,如天氣預(yù)報(bào)和心律失常表征。問題是這些領(lǐng)域中的大多數(shù)都涉及“高維”數(shù)據(jù),這意味著它聽起來像:具有大量維度或變量的數(shù)據(jù),有時(shí)數(shù)以百萬計(jì)。
Grigoriev 說,數(shù)據(jù)的維度如此之大,以至于“你迷路了,很難看到任何趨勢”。
他的團(tuán)隊(duì)提出了一種混合方法,將機(jī)器學(xué)習(xí)與傳統(tǒng)科學(xué)發(fā)現(xiàn)過程的元素相結(jié)合。這意味著理論描述、觀察、設(shè)計(jì)實(shí)驗(yàn)來測試描述,然后“然后在改進(jìn)理論和設(shè)計(jì)新實(shí)驗(yàn)之間來回切換。這是數(shù)百年來的傳統(tǒng)方法。”
科學(xué)的理解和進(jìn)步的基礎(chǔ)依賴于這種科學(xué)方法——理論與實(shí)驗(yàn)的結(jié)合。“它們不僅僅是基于數(shù)據(jù)開發(fā)的。它們是利用現(xiàn)有知識(shí)以及一些一般基本定律開發(fā)的。”
一種突出方程式之美的方法
Grigoriev 說,將數(shù)據(jù)限制為僅包含與所討論的實(shí)驗(yàn)直接相關(guān)的變量對于處理高維數(shù)據(jù)至關(guān)重要。
“這種方法允許你做的是確定一個(gè)使用你需要的變量的更簡單的模型。這是一種適用于特定情況的簡化描述,但使用計(jì)算或?qū)嶒?yàn)數(shù)據(jù)獲得。它可以做到這兩點(diǎn)。”
格里戈里耶夫說,結(jié)果用數(shù)學(xué)模型表示,“一旦你看到這些方程,你就會(huì)明白變量是什么。這些方程肯定有助于解釋物理問題的本質(zhì)。” 他的團(tuán)隊(duì)的方法在流體動(dòng)力學(xué)實(shí)驗(yàn)的研究中得到了驗(yàn)證。一層薄薄的液體懸浮在一個(gè)長方形的罐子里,磁場和電場穿過它,產(chǎn)生物理學(xué)家所說的湍流——液體層內(nèi)發(fā)生的不規(guī)則變化,可以迅速改變方向和大小。
Grigoriev 和他的團(tuán)隊(duì)使用他們的混合方法來分析可訪問的數(shù)據(jù),在這種情況下是水的速度。隨后,他們能夠重建無法直接測量的變量,如水壓和力。
格里戈里耶夫說,這就是方程式的美妙之處——它們允許你做多少。
“我們得到的是一個(gè)方程或一組方程,它們的形式很熟悉。我們知道如何解釋,如何使用這些方程解決問題。這是這種方法的好處。我們正在處理我們理解其含義的變量;我們知道如何解釋它們。”
該團(tuán)隊(duì)相信,該研究的結(jié)果將帶來進(jìn)步,例如更快、更準(zhǔn)確地預(yù)測科學(xué)、工程和醫(yī)學(xué)領(lǐng)域的大型現(xiàn)實(shí)問題中的復(fù)雜行為。例如,正如格里戈里耶夫團(tuán)隊(duì)的研究指出的那樣,“識(shí)別和量化大氣湍流的重要模式和序列的能力應(yīng)該能夠使天氣預(yù)報(bào)比目前可能的情況更好、更快。”
標(biāo)簽: 融合新舊學(xué)派