使用人工智能實時生成3D全息圖
一種稱為張量全息術(shù)的新方法可以為虛擬現(xiàn)實、3D打印、醫(yī)學成像等創(chuàng)建全息圖,并且可以在智能手機上運行。盡管多年來大肆宣傳,但虛擬現(xiàn)實耳機尚未取代電視或電腦屏幕,成為觀看視頻的首選設(shè)備。原因之一:VR會讓用戶感到惡心??赡軙е聬盒暮脱劬ζ冢驗閂R會產(chǎn)生3D觀看的錯覺,盡管用戶實際上是盯著固定距離的2D顯示器。更好的3D可視化解決方案可能在于為數(shù)字世界重新打造的60年前技術(shù):全息圖。
全息圖提供了我們周圍3D世界的特殊表現(xiàn)。另外,它們很漂亮。(繼續(xù)-查看您的Visa卡上的全息鴿子。)全息圖根據(jù)觀看者的位置提供變換視角,并且它們允許眼睛調(diào)整焦深以交替聚焦于前景和背景。
長期以來,研究人員一直試圖制作計算機生成的全息圖,但該過程傳統(tǒng)上需要一臺超級計算機來進行物理模擬,這既耗時又可能產(chǎn)生不那么逼真的結(jié)果。研究人員說,現(xiàn)在,麻省理工學院的研究人員已經(jīng)開發(fā)出一種幾乎可以立即生成全息圖的新方法——這種基于深度學習的方法非常高效,眨眼間就可以在筆記本電腦上運行。
“人們以前認為,使用現(xiàn)有的消費級硬件,不可能進行實時3D全息計算,”該研究的主要作者、麻省理工學院電氣工程與計算機科學系(EECS)博士生梁石說。“人們常說,商用全息顯示器將在10年內(nèi)問世,但這種說法已經(jīng)存在了幾十年。”
Shi相信,這種被團隊稱為“張量全息術(shù)”的新方法最終將使這個難以捉摸的10年目標觸手可及。這一進步可能會推動全息技術(shù)擴散到VR和3D打印等領(lǐng)域。
Shi與他的顧問和合著者WojciechMatusik共同完成了這項發(fā)表在《自然》雜志上的研究。其他合著者包括EECS和麻省理工學院計算機科學與人工智能實驗室的李北辰,以及前麻省理工學院研究人員ChangilKim(現(xiàn)供職Facebook)和PetrKellnhofer(現(xiàn)供職于斯坦福大學)。
追求更好的3D
典型的基于鏡頭的照片會對每個光波的亮度進行編碼——照片可以忠實地再現(xiàn)場景的顏色,但最終會產(chǎn)生平面圖像。
相比之下,全息圖對每個光波的亮度和相位進行編碼。這種組合可以更真實地描述場景的視差和深度。因此,雖然莫奈的“睡蓮”照片可以突出畫作的色覺,但全息圖可以使作品栩栩如生,呈現(xiàn)每個筆觸的獨特3D紋理。但是,盡管它們很現(xiàn)實,但全息圖的制作和分享仍然是一個挑戰(zhàn)。
最早于1900年代中期開發(fā)的早期全息圖是以光學方式記錄的。這需要分裂激光束,其中一半用于照亮對象,另一半用作光波相位的參考。這個參考產(chǎn)生了全息圖獨特的深度感。生成的圖像是靜態(tài)的,因此無法捕捉運動。而且它們只是硬拷貝,因此難以復制和共享。
計算機生成的全息通過模擬光學設(shè)置來回避這些挑戰(zhàn)。但這個過程可能是一個計算過程。“因為場景中的每個點都有不同的深度,所以不能對所有點應(yīng)用相同的操作,”施說。“這顯著增加了復雜性。”指揮集群超級計算機運行這些基于物理的模擬可能需要幾秒鐘或幾分鐘才能獲得單個全息圖像。此外,現(xiàn)有算法不能以逼真的精度對遮擋進行建模。所以施的團隊采取了不同的方法:讓計算機自學物理。
他們使用深度學習來加速計算機生成的全息圖,從而實現(xiàn)實時全息圖生成。該團隊設(shè)計了一個卷積神經(jīng)網(wǎng)絡(luò)——一種使用一系列可訓練張量來粗略模擬人類如何處理視覺信息的處理技術(shù)。訓練神經(jīng)網(wǎng)絡(luò)通常需要一個大型、高質(zhì)量的數(shù)據(jù)集,而3D全息圖以前不存在這種數(shù)據(jù)集。
該團隊建立了一個包含4,000對計算機生成圖像的自定義數(shù)據(jù)庫。每對匹配一張圖片——包括每個像素的顏色和深度信息——與其對應(yīng)的全息圖。為了在新數(shù)據(jù)庫中創(chuàng)建全息圖,研究人員使用了形狀和顏色復雜多變的場景,像素深度從背景到前景均勻分布,并使用一組新的基于物理的計算來處理遮擋。這種方法產(chǎn)生了逼真的訓練數(shù)據(jù)。接下來,算法開始工作。
通過從每個圖像對中學習,張量網(wǎng)絡(luò)調(diào)整了自己計算的參數(shù),連續(xù)增強了其創(chuàng)建全息圖的能力。完全優(yōu)化的網(wǎng)絡(luò)運行速度比基于物理的計算快幾個數(shù)量級。這種效率讓團隊自己感到驚訝。
“我們對它的表現(xiàn)感到驚訝,”Matusik說。在短短幾毫秒內(nèi),張量全息術(shù)可以根據(jù)具有深度信息的圖像制作全息圖——這些信息由典型的計算機生成圖像提供,并且可以通過多攝像頭設(shè)置或激光雷達傳感器(兩者都是一些新智能手機的標準配置)進行計算。這一進步為實時3D全息技術(shù)鋪平了道路。更重要的是,緊湊型張量網(wǎng)絡(luò)需要不到1MB的內(nèi)存。“考慮到最新款手機上有數(shù)十和數(shù)百GB的可用空間,這可以忽略不計,”他說。
這項研究“表明真正的3D全息顯示器是實用的,只需要適度的計算要求,”微軟首席光學架構(gòu)師喬爾科林說,他沒有參與這項研究。他補充說,“與之前的工作相比,這篇論文的圖像質(zhì)量有了顯著的提高”,這將“為觀看者增添真實感和舒適感”。Kollin還暗示了像這樣的全息顯示器甚至可以根據(jù)觀眾的眼科處方進行定制的可能性。“全息顯示器可以校正眼睛的像差。這使得顯示圖像比用戶使用隱形眼鏡或眼鏡看到的更清晰,這只能校正低階像差,如聚焦和散光。”
“相當大的飛躍”
實時3D全息將增強從VR到3D打印的一系列系統(tǒng)。該團隊表示,新系統(tǒng)可以幫助VR觀眾沉浸在更逼真的風景中,同時消除長期使用VR帶來的眼睛疲勞和其他副作用。該技術(shù)可以輕松部署在調(diào)制光波相位的顯示器上。目前,大多數(shù)經(jīng)濟實惠的消費級顯示器僅調(diào)節(jié)亮度,但如果廣泛采用相位調(diào)制顯示器的成本會下降。
研究人員說,3D全息還可以促進體積3D打印的發(fā)展。事實證明,這項技術(shù)比傳統(tǒng)的逐層3D打印更快、更精確,因為立體3D打印允許同時投影整個3D圖案。其他應(yīng)用包括顯微鏡、醫(yī)療數(shù)據(jù)可視化以及具有獨特光學特性的表面設(shè)計。
“這是一個相當大的飛躍,可以徹底改變?nèi)藗儗θ⒌膽B(tài)度,”Matusik說。“我們覺得神經(jīng)網(wǎng)絡(luò)就是為這項任務(wù)而生的。”
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!
-
安徽淮南長安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級。對于想要購買這款車的消...瀏覽全文>>
-
安徽阜陽的大眾高爾夫GTI作為一款備受年輕消費者喜愛的性能車型,其價格和配置一直是大家關(guān)注的重點。高爾夫GT...瀏覽全文>>
-
近年來,新能源汽車市場發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國內(nèi)市場上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時尚的外觀設(shè)計和實用的配置,吸引了眾多消費者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費者的關(guān)注。作為一款高端插電式混合動力SUV,...瀏覽全文>>
-
近年來,隨著新能源汽車的普及和政策支持的不斷加大,越來越多消費者將目光投向了插電混動車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費者的目光。在購...瀏覽全文>>
-
長安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來,新能源汽車市場持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當你看到T-Mobile用戶贏得手機手表和耳機時你會羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強大的159美元UBoomX便攜式揚聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機型扭轉(zhuǎn)了之前的趨勢
- Waze迎來魔獸世界改版
- SquareEnix將心愛的RPG移植到MetaQuest3
- 蘋果正在設(shè)計全新操作系統(tǒng)瞄準新類別的產(chǎn)品
- 小米RedmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價,各配置車型售價一目了然
- 生活家PHEV多少錢?購車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價格2025款,各配置車型售價全揭曉,性價比之王
- 淮北途觀L多少錢 2025款落地價,價格再創(chuàng)新低,性價比爆棚
- 山東濟南帕薩特新能源新款價格2025款多少錢?最低售價17.715萬起,性價比大揭秘
- SWM斯威G01FF新款價格2024款多少錢?看完這篇購車攻略再做決定
- 淮南ID.4 X價格,最低售價13.9888萬起,價格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機其價格低于摩托羅拉Razr2024
- OnePlus13型號 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運動相機競爭對手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無線控制器系列2通過Xbox設(shè)計實驗室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價更高
- 谷歌終止PixelBuds的點擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對AppleIntelligence功能的評價從一般到還可以
- GalaxyS25Plus看起來很時髦但三星是否選擇像iPhone一樣的通用設(shè)計
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價同時贈送100美元Xbox禮品卡和1年保護計劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價格
- Valve出售部分SteamDeck型號-GBLCD型號售價296.65美元512GBLCD型號售價336.75美元
- Beats在其產(chǎn)品線中增加了手機保護殼推出適用于iPhone16系列的MagSafe保護殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡單地與之交談就像ChatGPT一樣
- 極簡主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂