新的機(jī)器學(xué)習(xí)方法可以改善環(huán)境預(yù)測
機(jī)器學(xué)習(xí)算法每天為我們做很多事情——將不需要的電子郵件發(fā)送到我們的垃圾郵件文件夾,在我們的汽車即將恢復(fù)正常時(shí)警告我們,并就接下來要看的電視節(jié)目向我們提供建議?,F(xiàn)在,我們?cè)絹碓蕉嗟厥褂眠@些相同的算法來為我們進(jìn)行環(huán)境預(yù)測。
來自明尼蘇達(dá)大學(xué)、匹茲堡大學(xué)和美國地質(zhì)調(diào)查局的一組研究人員最近 在 2021 年工業(yè)和應(yīng)用數(shù)學(xué)學(xué)會(huì) (SIAM) 數(shù)據(jù)挖掘國際會(huì)議 (SDM21)上發(fā)表了一項(xiàng)關(guān)于預(yù)測河網(wǎng)流量和溫度的 新研究) 訴訟。該研究由美國國家科學(xué)基金會(huì) (NSF) 資助。
該研究展示了一種新的機(jī)器學(xué)習(xí)方法,其中算法被“教授”物理世界的規(guī)則,以便做出更好的預(yù)測并將算法引導(dǎo)到輸入和輸出之間具有物理意義的關(guān)系。
該研究提出了一個(gè)模型,即使在可用數(shù)據(jù)很少的情況下,也可以更準(zhǔn)確地預(yù)測河流和溪流的溫度,大多數(shù)河流和溪流都是這種情況。該模型還可以更好地泛化到不同的時(shí)間段。
“溪流中的水溫是許多重要水生系統(tǒng)的‘主變量’,包括水生棲息地的適宜性、蒸發(fā)率、溫室氣體交換和熱電能源生產(chǎn)效率,”該研究的第一作者賈曉偉說。 匹茲堡 大學(xué)計(jì)算機(jī)與信息學(xué)院計(jì)算機(jī)科學(xué)系助理教授 。“準(zhǔn)確預(yù)測水溫和流量也有助于資源管理者的決策,例如幫助他們確定何時(shí)以及從水庫向下游河流釋放多少水。
對(duì)機(jī)器學(xué)習(xí)的一個(gè)普遍批評(píng)是預(yù)測并不植根于物理意義。也就是說,算法只是尋找輸入和輸出之間的相關(guān)性,有時(shí)這些相關(guān)性可能是“虛假的”或給出錯(cuò)誤的結(jié)果。該模型通常無法處理輸入和輸出之間的關(guān)系發(fā)生變化的情況。
賈發(fā)表的新方法,他也是 2020 年的博士。明尼蘇達(dá)大學(xué)科學(xué)與工程學(xué)院計(jì)算機(jī)科學(xué)與工程系的畢業(yè)生,他的同事使用“過程引導(dǎo)或知識(shí)引導(dǎo)的機(jī)器學(xué)習(xí)”。該方法應(yīng)用于特拉華河流域 (DRB) 的水溫預(yù)測用例,旨在克服使用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測的一些常見缺陷。該方法通過一個(gè)相對(duì)簡單的過程通知機(jī)器學(xué)習(xí)模型——時(shí)間相關(guān)性、流之間的空間連接和能量預(yù)算方程。
河流溫度動(dòng)態(tài)的數(shù)據(jù)稀疏性和可并不是特拉華河流域獨(dú)有的。相對(duì)于美國的大部分地區(qū),特拉華河流域的水溫監(jiān)測良好。因此,特拉華河流域是開發(fā)河流溫度預(yù)測新方法的理想場所。
美國地質(zhì)調(diào)查局發(fā)布的交互式視覺解釋器 強(qiáng)調(diào)了這些模型的發(fā)展以及水溫預(yù)測在 DRB 中的重要性。可視化展示了社會(huì)對(duì)水溫預(yù)測的需求,水庫為超過 1500 萬人提供飲用水,但也有競爭性的用水需求,以維持重要游魚物種的下游流量和冷水棲息地。當(dāng)水庫管理者預(yù)計(jì)水溫將超過臨界閾值時(shí),他們可以釋放冷水,準(zhǔn)確的水溫預(yù)測是僅在必要時(shí)使用有限水資源的關(guān)鍵。
最近的研究建立在美國地質(zhì)調(diào)查局的水科學(xué)家和明尼蘇達(dá)大學(xué)雙城分校計(jì)算機(jī)科學(xué)家在 科學(xué)與工程學(xué)院計(jì)算機(jī)科學(xué)與工程系Vipin Kumar 教授實(shí)驗(yàn)室的合作基礎(chǔ)上 ,研究人員一直在那里開發(fā)知識(shí)引導(dǎo)機(jī)器學(xué)習(xí)技術(shù)。
“這些以知識(shí)為導(dǎo)向的機(jī)器學(xué)習(xí)技術(shù)從根本上比科學(xué)界用來解決環(huán)境問題的標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)方法和傳統(tǒng)機(jī)械模型更強(qiáng)大,”庫馬爾說。
由 NSF 的利用數(shù)據(jù)革命計(jì)劃資助的新一代機(jī)器學(xué)習(xí)方法正被用于解決各種環(huán)境問題,例如改善湖泊和河流溫度預(yù)測。
在 由明尼蘇達(dá)大學(xué)計(jì)算機(jī)科學(xué)與工程系博士領(lǐng)導(dǎo)的美國地球物理聯(lián)盟水資源研究中心另一項(xiàng)由 NSF 資助的關(guān)于預(yù)測未監(jiān)測湖泊水溫動(dòng)態(tài)的新研究中。在候選人 Jared Willard 的帶領(lǐng)下,研究人員展示了如何使用知識(shí)引導(dǎo)的機(jī)器學(xué)習(xí)模型來解決最具挑戰(zhàn)性的環(huán)境預(yù)測問題之一——在不受監(jiān)控的生態(tài)系統(tǒng)中進(jìn)行預(yù)測。
模型從觀測良好的湖泊轉(zhuǎn)移到觀測很少或沒有觀測的湖泊,即使在不存在溫度觀測的湖泊中也能進(jìn)行準(zhǔn)確預(yù)測。研究人員表示,他們的方法很容易擴(kuò)展到數(shù)千個(gè)湖泊,這表明該方法(具有有意義的預(yù)測變量和高質(zhì)量的源模型)是未來許多未受監(jiān)控系統(tǒng)和環(huán)境變量的有前途的方法。
標(biāo)簽: 機(jī)器學(xué)習(xí)方法