通過用于下一代圖像傳感的高級機(jī)器學(xué)習(xí)進(jìn)行無鏡頭成像
在“無鏡頭”成像的重大發(fā)展中,東京工業(yè)大學(xué)(東京工業(yè)大學(xué))工程學(xué)院的一個研究小組設(shè)計了一種新的圖像重建方法,可以在很短的計算時間內(nèi)實現(xiàn)高質(zhì)量的成像。新方法基于稱為VisionTransformer的前沿機(jī)器學(xué)習(xí)技術(shù),極大地促進(jìn)了“無鏡頭”相機(jī)的實際應(yīng)用。
相機(jī)通常需要鏡頭系統(tǒng)來捕捉聚焦圖像,而鏡頭相機(jī)幾個世紀(jì)以來一直是主要的成像解決方案。鏡頭相機(jī)需要復(fù)雜的鏡頭系統(tǒng)來實現(xiàn)高質(zhì)量、明亮和無像差的成像。近幾十年來,人們對更小、更輕、更便宜的相機(jī)的需求激增。顯然需要具有強(qiáng)大功能的下一代相機(jī),這些相機(jī)足夠緊湊,可以安裝在任何地方。然而,鏡頭相機(jī)的小型化受到鏡頭系統(tǒng)和折射鏡頭所需的聚焦距離的限制。
計算技術(shù)的最新進(jìn)展可以通過用計算代替光學(xué)系統(tǒng)的某些部分來簡化鏡頭系統(tǒng)。由于使用了圖像重建計算,可以放棄整個鏡頭,從而實現(xiàn)超薄、輕量、低成本的無鏡頭相機(jī)。無鏡頭相機(jī)最近越來越受歡迎。但迄今為止,圖像重建技術(shù)尚未建立,導(dǎo)致無鏡頭相機(jī)的成像質(zhì)量不足和計算時間冗長。
最近,研究人員開發(fā)了一種新的圖像重建方法,可以縮短計算時間并提供高質(zhì)量的圖像。研究團(tuán)隊的核心成員、東京工業(yè)大學(xué)的MasahiroYamaguchi教授在描述這項研究背后的最初動機(jī)時說:“沒有鏡頭的限制,無鏡頭相機(jī)可以是超微型的,可以實現(xiàn)新的應(yīng)用。這超出了我們的想象。”他們的工作已發(fā)表在OpticsLetters上。
無鏡頭相機(jī)的典型光學(xué)硬件僅由薄掩模和圖像傳感器組成。然后使用數(shù)學(xué)算法重建圖像,如圖1所示。掩模和傳感器可以在已建立的半導(dǎo)體制造工藝中一起制造,以供將來生產(chǎn)。掩模對入射光進(jìn)行光學(xué)編碼并在傳感器上投射圖案。盡管鑄造的圖案對人眼來說是完全不可解釋的,但它們可以通過光學(xué)系統(tǒng)的明確知識進(jìn)行解碼。
圖1.無鏡頭成像流程。無鏡頭成像過程如何工作的示意圖,從光收集到對信號進(jìn)行編碼,再到使用計算算法進(jìn)行后處理。圖片來源:東京科技的XiuxiPan
然而,基于圖像重建技術(shù)的解碼過程仍然具有挑戰(zhàn)性。傳統(tǒng)的基于模型的解碼方法近似于無透鏡光學(xué)器件的物理過程,并通過解決“凸”優(yōu)化問題來重建圖像。
這意味著重建結(jié)果容易受到物理模型不完美近似的影響。此外,解決優(yōu)化問題所需的計算非常耗時,因為它需要迭代計算。
深度學(xué)習(xí)可以幫助避免基于模型的解碼的局限性,因為它可以學(xué)習(xí)模型并通過非迭代的直接過程來解碼圖像。然而,現(xiàn)有的使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)的無鏡頭成像深度學(xué)習(xí)方法無法生成高質(zhì)量的圖像。它們效率低下,因為CNN基于相鄰“局部”像素的關(guān)系處理圖像,而無透鏡光學(xué)系統(tǒng)通過屬性將場景中的局部信息轉(zhuǎn)換為圖像傳感器所有像素上重疊的“全局”信息稱為“多路復(fù)用”。
TokyoTech研究團(tuán)隊正在研究這種多路復(fù)用特性,現(xiàn)在已經(jīng)提出了一種用于圖像重建的新型專用機(jī)器學(xué)習(xí)算法。所提出的算法,如圖2所示,基于一種稱為VisionTransformer(ViT)的前沿機(jī)器學(xué)習(xí)技術(shù),該技術(shù)在全局特征推理方面表現(xiàn)更好。
該算法的新穎之處在于具有重疊“補(bǔ)丁”模塊的多級變壓器塊的結(jié)構(gòu)。這允許它有效地學(xué)習(xí)分層表示中的圖像特征。因此,所提出的方法可以很好地解決復(fù)用特性,避免傳統(tǒng)基于CNN的深度學(xué)習(xí)的局限性,從而實現(xiàn)更好的圖像重建。
圖2.建議的基于ViT的圖像重建神經(jīng)網(wǎng)絡(luò)。VisionTransformer(ViT)是領(lǐng)先的機(jī)器學(xué)習(xí)技術(shù),由于其具有重疊“patchify”模塊的多級變壓器塊的新穎結(jié)構(gòu),它在全局特征推理方面表現(xiàn)更好。這使其能夠有效地學(xué)習(xí)分層表示中的圖像特征,使其能夠解決多路復(fù)用特性并避免傳統(tǒng)基于CNN的深度學(xué)習(xí)的限制,從而實現(xiàn)更好的圖像重建。圖片來源:東京科技的XiuxiPan
雖然傳統(tǒng)的基于模型的方法需要較長的計算時間來進(jìn)行迭代處理,但所提出的方法更快,因為直接重建可以通過機(jī)器學(xué)習(xí)設(shè)計的無迭代處理算法進(jìn)行。
由于機(jī)器學(xué)習(xí)系統(tǒng)學(xué)習(xí)物理模型,模型逼近誤差的影響也顯著降低。此外,所提出的基于ViT的方法使用圖像中的全局特征,適用于在圖像傳感器上處理大范圍的投射模式,而傳統(tǒng)的基于機(jī)器學(xué)習(xí)的解碼方法主要通過CNN學(xué)習(xí)局部關(guān)系。
總之,所提出的方法解決了傳統(tǒng)方法的局限性,例如基于迭代圖像重建的處理和基于CNN的機(jī)器學(xué)習(xí)與ViT架構(gòu),能夠在較短的計算時間內(nèi)獲取高質(zhì)量的圖像。
研究小組進(jìn)一步進(jìn)行了光學(xué)實驗——正如他們在最新出版物中所報道的——這表明采用所提出的重建方法的無鏡頭相機(jī)可以產(chǎn)生高質(zhì)量和視覺上吸引人的圖像,而后處理計算的速度足夠高實時捕捉。組裝好的無鏡頭相機(jī)和實驗結(jié)果分別如圖3和圖4所示。
“我們意識到小型化不應(yīng)該是無鏡頭相機(jī)的唯一優(yōu)勢。無鏡頭相機(jī)可以應(yīng)用于不可見光成像,其中使用鏡頭是不切實際甚至不可能的。此外,無鏡頭相機(jī)捕獲的光學(xué)信息的潛在維度大于2,這使得一次性3D成像和捕獲后重新聚焦成為可能。我們正在探索無鏡頭相機(jī)的更多功能。無鏡頭相機(jī)的最終目標(biāo)是微型而強(qiáng)大。我們很高興能夠引領(lǐng)下一代成像和傳感解決方案的新方向,”該研究的主要作者、東京科技大學(xué)的XiuxiPan先生在談到他們未來的工作時說。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!
-
安徽淮南長安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級。對于想要購買這款車的消...瀏覽全文>>
-
安徽阜陽的大眾高爾夫GTI作為一款備受年輕消費(fèi)者喜愛的性能車型,其價格和配置一直是大家關(guān)注的重點。高爾夫GT...瀏覽全文>>
-
近年來,新能源汽車市場發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國內(nèi)市場上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時尚的外觀設(shè)計和實用的配置,吸引了眾多消費(fèi)者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費(fèi)者的關(guān)注。作為一款高端插電式混合動力SUV,...瀏覽全文>>
-
近年來,隨著新能源汽車的普及和政策支持的不斷加大,越來越多消費(fèi)者將目光投向了插電混動車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費(fèi)者的目光。在購...瀏覽全文>>
-
長安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來,新能源汽車市場持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費(fèi)者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當(dāng)你看到T-Mobile用戶贏得手機(jī)手表和耳機(jī)時你會羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強(qiáng)的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強(qiáng)大的159美元UBoomX便攜式揚(yáng)聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機(jī)型扭轉(zhuǎn)了之前的趨勢
- Waze迎來魔獸世界改版
- SquareEnix將心愛的RPG移植到MetaQuest3
- 蘋果正在設(shè)計全新操作系統(tǒng)瞄準(zhǔn)新類別的產(chǎn)品
- 小米RedmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價,各配置車型售價一目了然
- 生活家PHEV多少錢?購車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價格2025款,各配置車型售價全揭曉,性價比之王
- 淮北途觀L多少錢 2025款落地價,價格再創(chuàng)新低,性價比爆棚
- 山東濟(jì)南帕薩特新能源新款價格2025款多少錢?最低售價17.715萬起,性價比大揭秘
- SWM斯威G01FF新款價格2024款多少錢?看完這篇購車攻略再做決定
- 淮南ID.4 X價格,最低售價13.9888萬起,價格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機(jī)其價格低于摩托羅拉Razr2024
- OnePlus13型號 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運(yùn)動相機(jī)競爭對手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無線控制器系列2通過Xbox設(shè)計實驗室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價更高
- 谷歌終止PixelBuds的點擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對AppleIntelligence功能的評價從一般到還可以
- GalaxyS25Plus看起來很時髦但三星是否選擇像iPhone一樣的通用設(shè)計
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價同時贈送100美元Xbox禮品卡和1年保護(hù)計劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價格
- Valve出售部分SteamDeck型號-GBLCD型號售價296.65美元512GBLCD型號售價336.75美元
- Beats在其產(chǎn)品線中增加了手機(jī)保護(hù)殼推出適用于iPhone16系列的MagSafe保護(hù)殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡單地與之交談就像ChatGPT一樣
- 極簡主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂