機(jī)器學(xué)習(xí)有助于繪制全球海洋社區(qū)的地圖
在陸地上,顯而易見(jiàn)的是,一個(gè)生態(tài)區(qū)域在哪里結(jié)束而另一生態(tài)區(qū)域在哪里開(kāi)始,例如在沙漠和稀樹(shù)草原之間的邊界處。在海洋中,生命的大部分是微觀的,并且流動(dòng)性強(qiáng)得多,這給科學(xué)家們繪制生態(tài)上獨(dú)特的海洋區(qū)域之間的邊界圖帶來(lái)了挑戰(zhàn)。
科學(xué)家描繪海洋群落的一種方式是通過(guò)衛(wèi)星圖像的葉綠素(浮游植物產(chǎn)生的綠色色素)。葉綠素濃度可以表明一個(gè)區(qū)域與另一個(gè)區(qū)域相比,潛在生態(tài)系統(tǒng)的豐富程度或生產(chǎn)力。但是葉綠素圖只能給出給定區(qū)域中可能存在的總生命量的信息。實(shí)際上,葉綠素濃度相同的兩個(gè)區(qū)域?qū)嶋H上可能具有植物和動(dòng)物生命的不同組合。
麻省理工學(xué)院開(kāi)發(fā)的機(jī)器學(xué)習(xí)技術(shù)根據(jù)浮游植物物種之間的相互作用,梳理全球海洋數(shù)據(jù),以發(fā)現(xiàn)海洋位置之間的共性。使用這種方法,研究人員已經(jīng)確定,海洋可以分為100多種“省”和12種“巨型省”,它們的生態(tài)構(gòu)成各不相同。圖片來(lái)源:由研究人員提供,由麻省理工學(xué)院新聞社編輯。
“就像您要看一看陸地上所有生物量不多的地區(qū),包括南極洲和撒哈拉沙漠,即使它們的生態(tài)組合完全不同,”前博士后邁克·索納瓦爾德(Maike Sonnewald)說(shuō)。麻省理工學(xué)院的地球,大氣和行星科學(xué)系。
現(xiàn)在,麻省理工學(xué)院的Sonnewald和她的同事們開(kāi)發(fā)了一種無(wú)監(jiān)督的機(jī)器學(xué)習(xí)技術(shù),該技術(shù)可以自動(dòng)梳理一組高度復(fù)雜的全球海洋數(shù)據(jù),根據(jù)它們的比例和多種浮游植物物種之間的相互作用來(lái)找到海洋位置之間的共性。通過(guò)他們的技術(shù),研究人員發(fā)現(xiàn),海洋可以分為100多種類型各異的“省份”,這些省份的生態(tài)結(jié)構(gòu)各不相同??梢韵胂螅Q笾腥魏谓o定的位置都可以容納這100個(gè)生態(tài)省中的一個(gè)。
然后,研究人員在這100個(gè)省之間尋找相似之處,最終將它們分為12個(gè)更一般的類別。從這些“大省”中,他們可以看到,盡管有些人在一個(gè)區(qū)域內(nèi)的生活總量相同,但他們的社區(qū)結(jié)構(gòu)或動(dòng)植物種類的平衡卻大不相同。索納瓦爾德說(shuō),捕捉這些生態(tài)微妙之處對(duì)于追蹤海洋的健康和生產(chǎn)力至關(guān)重要。
Sonnewald說(shuō):“生態(tài)系統(tǒng)隨著氣候變化而變化,需要監(jiān)測(cè)社區(qū)結(jié)構(gòu),以了解對(duì)漁業(yè)的影響以及海洋吸收二氧化碳的能力。” “我們無(wú)法用傳統(tǒng)方法完全理解這些至關(guān)重要的動(dòng)力,到目前為止,還沒(méi)有包括那里的生態(tài)系統(tǒng)。但是我們的方法與衛(wèi)星數(shù)據(jù)和其他工具相結(jié)合,可以提供重要的進(jìn)展。”
索納瓦爾德(Sonnewald)現(xiàn)在是普林斯頓大學(xué)的副研究員和華盛頓大學(xué)的訪問(wèn)者,他在《科學(xué)進(jìn)展》雜志上報(bào)道了這一結(jié)果。她在MIT的合著者是高級(jí)研究科學(xué)家Stephanie Dutkiewitz,首席研究工程師Christopher Hill和研究科學(xué)家Gael Forget。
推出數(shù)據(jù)球
團(tuán)隊(duì)的新機(jī)器學(xué)習(xí)技術(shù)(他們將其稱為SAGE)用于系統(tǒng)化聚合生態(tài)省方法,旨在處理大型,復(fù)雜的數(shù)據(jù)集,并有可能將該數(shù)據(jù)投影到一個(gè)更簡(jiǎn)單的低維數(shù)據(jù)集。
“這就像制作餅干一樣,” Sonnewald說(shuō)。“您需要收集這些極其復(fù)雜的數(shù)據(jù)并將其推出以揭示其元素。”
特別是,研究人員使用了Sonnewald所說(shuō)的聚類算法,該算法旨在“沿著數(shù)據(jù)集爬行”并在點(diǎn)密度較大的區(qū)域中進(jìn)行磨練-這表明這些點(diǎn)具有某些共同點(diǎn)。
Sonnewald和她的同事們?cè)诼槭±砉W(xué)院的達(dá)爾文項(xiàng)目的海洋數(shù)據(jù)上放寬了該算法,該項(xiàng)目是全球海洋的三維模型,將海洋氣候模型(包括風(fēng),流和溫度模式)與海洋生態(tài)模型結(jié)合在一起。該模型包括51種浮游植物,以及每種植物的生長(zhǎng)和相互作用方式以及與周圍氣候和可用養(yǎng)分的相互作用方式。
Sonnewald表示,如果人們?cè)噲D瀏覽這個(gè)非常復(fù)雜的51層數(shù)據(jù)空間,以了解海洋中每個(gè)可用點(diǎn)的共同特征,那么這項(xiàng)任務(wù)將是“人類難以處理的”。使用該團(tuán)隊(duì)的無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法,這種共性“開(kāi)始變得清晰起來(lái)”。
該小組的SAGE方法中的第一個(gè)“數(shù)據(jù)清理”步驟能夠?qū)⑷蚝Q蠼馕鰹榇蠹s100個(gè)不同的生態(tài)省,每個(gè)省都有獨(dú)特的物種平衡。
研究人員將海洋模型中的每個(gè)可用位置分配給了100個(gè)省中的一個(gè),并為每個(gè)省分配了一種顏色。然后,他們生成了一張全球海洋地圖,并按省份類型進(jìn)行了著色。
索納瓦爾德說(shuō):“在南極洲周圍的南大洋,在環(huán)繞著南極洲的這些緯向條紋中,有勃艮第和橙色的顏色塑造了我們對(duì)它們的期望。” “與其他功能一起,至少在模型中,這給了我們很大的信心,使我們的方法有效并且有意義。”
生態(tài)統(tǒng)一
然后,研究小組尋找方法來(lái)進(jìn)一步簡(jiǎn)化他們確定的100多個(gè)省,以查看即使在這些生態(tài)截然不同的地區(qū)之間,他們是否也可以找出共同點(diǎn)。
“我們開(kāi)始考慮類似的事情,如何將一群人彼此區(qū)分開(kāi)?我們?nèi)绾慰创舜酥g的聯(lián)系?我們使用這種直覺(jué)來(lái)看看我們是否可以量化不同省份在生態(tài)上的相似程度。”索納瓦爾德說(shuō)。
為此,研究小組運(yùn)用圖論技術(shù),根據(jù)生物量,在一張圖中代表了所有100個(gè)省。這類似于一個(gè)地區(qū)產(chǎn)生的葉綠素?cái)?shù)量。他們選擇將100個(gè)省分為12個(gè)大類,即“特大省”。當(dāng)他們比較這些大型省份時(shí),他們發(fā)現(xiàn)那些具有相似生物量的省份是由截然不同的生物物種組成的。
“例如,省D和K的生物量幾乎相同,但是當(dāng)我們深入研究時(shí),K的硅藻幾乎沒(méi)有原核生物,而D的硅藻幾乎沒(méi)有,原核生物很多。但是從衛(wèi)星看,它們看起來(lái)可能一樣。”索納瓦爾德說(shuō)。“因此,我們的方法可以開(kāi)始將生態(tài)信息添加到大量葉綠素措施中的過(guò)程,并最終有助于觀察。”
該團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)在線小部件,研究人員可使用該小部件查找100個(gè)省之間的其他相似之處。在他們的論文中,Sonnewald的同事選擇將這些省分為12類。但是其他人可能希望將省份劃分為更多的組,并深入研究數(shù)據(jù)以查看這些組之間共有的特征。
索納瓦爾德(Sonnewald)正在與海洋學(xué)家共享該工具,這些海洋學(xué)家希望精確確定特定生態(tài)組成的區(qū)域位于何處,因此,他們可以例如在這些區(qū)域而不是在物種平衡可能略有不同的其他區(qū)域中派遣船只進(jìn)行采樣。
“與其使用基于大量葉綠素的工具指導(dǎo)采樣,并猜測(cè)使用此方法可以發(fā)現(xiàn)有趣的生態(tài)學(xué),還不如說(shuō)是外科手術(shù),說(shuō),'這就是該模型在這里可能會(huì)發(fā)現(xiàn)的,'” Sonnewald說(shuō)。“了解諸如海洋科學(xué)和全球漁業(yè)之類的物種組合的確非常重要。”
標(biāo)簽: 機(jī)器學(xué)習(xí)