走向可以像人類一樣推理代碼的深度學(xué)習(xí)模型
無論公司從事何種業(yè)務(wù),軟件都扮演著越來越重要的角色,從管理庫存到與客戶互動(dòng)。因此,對(duì)軟件開發(fā)人員的需求比以往任何時(shí)候都大,這推動(dòng)了將一些占用他們時(shí)間的更簡(jiǎn)單任務(wù)自動(dòng)化的趨勢(shì)。
Eclipse 和 Visual Studio 等生產(chǎn)力工具會(huì)建議代碼片段,開發(fā)人員可以在編寫時(shí)輕松放入他們的工作中。這些自動(dòng)化功能由復(fù)雜的語言模型提供支持,這些語言模型在吸收了數(shù)千個(gè)示例后學(xué)會(huì)了讀寫計(jì)算機(jī)代碼。但是,與在沒有明確指令的情況下在大數(shù)據(jù)集上訓(xùn)練的其他深度學(xué)習(xí)模型一樣,專為代碼處理而設(shè)計(jì)的語言模型也存在內(nèi)置漏洞。
由 MIT 和 IBM 研究人員構(gòu)建的框架發(fā)現(xiàn)并修復(fù)了自動(dòng)編程工具中的弱點(diǎn),這些弱點(diǎn)使它們?nèi)菀资艿焦簟R环N工具(如圖)隨著程序員編寫和建議代碼而閱讀。在這里,它從 Python 的 NumPy 庫中的數(shù)千個(gè)選項(xiàng)中挑選最適合手頭任務(wù)的函數(shù)。圖片來源:麻省理工學(xué)院的 Shashank Srikant
“除非你真的很小心,否則黑客可以巧妙地操縱這些模型的輸入,讓它們預(yù)測(cè)任何事情,”麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)系的研究生Shashank Srikant說 。“我們正在努力研究并防止這種情況發(fā)生。”
在一篇新論文中,Srikant 和 MIT-IBM Watson AI Lab推出了一種自動(dòng)方法,用于查找代碼處理模型中的弱點(diǎn)并重新訓(xùn)練它們以提高抵御攻擊的能力。這是 MIT 研究員Una-May O'Reilly 和 IBM 附屬研究員 Sijia Liu共同努力的一部分, 旨在利用 AI 使自動(dòng)化編程工具更智能、更安全。該團(tuán)隊(duì)將在國際學(xué)習(xí)代表會(huì)議上展示其結(jié)果。
一臺(tái)能夠自我編程的機(jī)器曾經(jīng)看起來像科幻小說。但是,計(jì)算能力的指數(shù)級(jí)增長、自然語言處理的進(jìn)步以及互聯(lián)網(wǎng)上的大量免費(fèi)代碼使得軟件設(shè)計(jì)的至少某些方面的自動(dòng)化成為可能。
在 GitHub 和其他程序共享網(wǎng)站上接受過訓(xùn)練,代碼處理模型學(xué)習(xí)生成程序,就像其他語言模型學(xué)習(xí)編寫新聞故事或詩歌一樣。這使他們能夠充當(dāng)智能助手,預(yù)測(cè)軟件開發(fā)人員接下來會(huì)做什么,并提供幫助。他們可能會(huì)建議適合手頭任務(wù)的程序,或者生成程序摘要來記錄軟件的工作方式。還可以訓(xùn)練代碼處理模型來查找和修復(fù)錯(cuò)誤。但是,盡管它們具有提高生產(chǎn)力和改進(jìn)軟件質(zhì)量的潛力,但它們帶來了研究人員剛剛開始發(fā)現(xiàn)的安全風(fēng)險(xiǎn)。
Srikant 和他的同事發(fā)現(xiàn),代碼處理模型可以通過簡(jiǎn)單地重命名變量、插入虛假的打印語句或?qū)⑵渌揎棽僮饕肽P驮噲D處理的程序來欺騙。 這些經(jīng)過巧妙修改的程序正常運(yùn)行,但會(huì)欺騙模型錯(cuò)誤地處理它們,從而做出錯(cuò)誤的決定。
這些錯(cuò)誤會(huì)對(duì)所有類型的代碼處理模型產(chǎn)生嚴(yán)重的后果。惡意軟件檢測(cè)模型可能會(huì)被欺騙,將惡意程序誤認(rèn)為良性程序。代碼完成模型可能會(huì)被欺騙提供錯(cuò)誤或惡意的建議。在這兩種情況下,病毒都可能被毫無戒心的程序員偷偷溜走。一個(gè)類似的問題困擾著計(jì)算機(jī)視覺模型:正如麻省理工學(xué)院的其他研究表明的那樣,編輯輸入圖像中的幾個(gè)關(guān)鍵像素,模型可能會(huì)將豬混淆為飛機(jī),將烏龜混淆 為步槍。
就像最好的語言模型一樣,代碼處理模型有一個(gè)關(guān)鍵缺陷:它們是單詞和短語之間統(tǒng)計(jì)關(guān)系的專家,但只能模糊地掌握它們的真正含義。例如,OpenAI 的 GPT-3 語言模型可以寫出從雄辯到荒謬的散文,但只有人類讀者才能分辨出其中的區(qū)別。
代碼處理模型也不例外。“如果他們真的在學(xué)習(xí)程序的內(nèi)在屬性,那么應(yīng)該很難欺騙他們,”Srikant 說。“但他們不是。他們目前相對(duì)容易被欺騙。”
在論文中,研究人員提出了一個(gè)框架,用于自動(dòng)更改程序以暴露處理它們的模型中的弱點(diǎn)。它解決了一個(gè)兩部分的優(yōu)化問題;算法識(shí)別程序中添加或替換文本會(huì)導(dǎo)致模型出現(xiàn)最大錯(cuò)誤的站點(diǎn)。它還確定了哪些類型的編輯構(gòu)成了最大的威脅。
研究人員說,該框架揭示的是某些模型是多么脆弱。當(dāng)對(duì)程序進(jìn)行一次編輯時(shí),他們的文本摘要模型失敗了三分之一;他們報(bào)告說,在進(jìn)行了五次編輯時(shí),有一半以上的時(shí)間都失敗了。另一方面,他們表明該模型能夠從錯(cuò)誤中學(xué)習(xí), 并在此過程中潛在地獲得對(duì)編程的更深入理解。
該研究的共同資深作者劉說:“我們用于攻擊模型并針對(duì)這些特定漏洞對(duì)其進(jìn)行重新訓(xùn)練的框架,可能有助于代碼處理模型更好地掌握程序的意圖。” “這是一個(gè)有待探索的令人興奮的方向。”
在后臺(tái),一個(gè)更大的問題仍然存在:這些黑盒深度學(xué)習(xí)模型到底在學(xué)習(xí)什么?“他們是否像人類一樣推理代碼,如果不是,我們?nèi)绾沃谱魉鼈?” 奧萊利說。“這是我們面臨的巨大挑戰(zhàn)。”
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
-
安徽淮南長安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級(jí)。對(duì)于想要購買這款車的消...瀏覽全文>>
-
安徽阜陽的大眾高爾夫GTI作為一款備受年輕消費(fèi)者喜愛的性能車型,其價(jià)格和配置一直是大家關(guān)注的重點(diǎn)。高爾夫GT...瀏覽全文>>
-
近年來,新能源汽車市場(chǎng)發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國內(nèi)市場(chǎng)上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時(shí)尚的外觀設(shè)計(jì)和實(shí)用的配置,吸引了眾多消費(fèi)者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場(chǎng)的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費(fèi)者的關(guān)注。作為一款高端插電式混合動(dòng)力SUV,...瀏覽全文>>
-
近年來,隨著新能源汽車的普及和政策支持的不斷加大,越來越多消費(fèi)者將目光投向了插電混動(dòng)車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費(fèi)者的目光。在購...瀏覽全文>>
-
長安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來,新能源汽車市場(chǎng)持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費(fèi)者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當(dāng)你看到T-Mobile用戶贏得手機(jī)手表和耳機(jī)時(shí)你會(huì)羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強(qiáng)的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強(qiáng)大的159美元UBoomX便攜式揚(yáng)聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機(jī)型扭轉(zhuǎn)了之前的趨勢(shì)
- Waze迎來魔獸世界改版
- SquareEnix將心愛的RPG移植到MetaQuest3
- 蘋果正在設(shè)計(jì)全新操作系統(tǒng)瞄準(zhǔn)新類別的產(chǎn)品
- 小米R(shí)edmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價(jià),各配置車型售價(jià)一目了然
- 生活家PHEV多少錢?購車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗(yàn)卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價(jià)格2025款,各配置車型售價(jià)全揭曉,性價(jià)比之王
- 淮北途觀L多少錢 2025款落地價(jià),價(jià)格再創(chuàng)新低,性價(jià)比爆棚
- 山東濟(jì)南帕薩特新能源新款價(jià)格2025款多少錢?最低售價(jià)17.715萬起,性價(jià)比大揭秘
- SWM斯威G01FF新款價(jià)格2024款多少錢?看完這篇購車攻略再做決定
- 淮南ID.4 X價(jià)格,最低售價(jià)13.9888萬起,價(jià)格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價(jià)與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機(jī)其價(jià)格低于摩托羅拉Razr2024
- OnePlus13型號(hào) 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運(yùn)動(dòng)相機(jī)競(jìng)爭(zhēng)對(duì)手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無線控制器系列2通過Xbox設(shè)計(jì)實(shí)驗(yàn)室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價(jià)更高
- 谷歌終止PixelBuds的點(diǎn)擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對(duì)AppleIntelligence功能的評(píng)價(jià)從一般到還可以
- GalaxyS25Plus看起來很時(shí)髦但三星是否選擇像iPhone一樣的通用設(shè)計(jì)
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價(jià)同時(shí)贈(zèng)送100美元Xbox禮品卡和1年保護(hù)計(jì)劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價(jià)格
- Valve出售部分SteamDeck型號(hào)-GBLCD型號(hào)售價(jià)296.65美元512GBLCD型號(hào)售價(jià)336.75美元
- Beats在其產(chǎn)品線中增加了手機(jī)保護(hù)殼推出適用于iPhone16系列的MagSafe保護(hù)殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡(jiǎn)單地與之交談就像ChatGPT一樣
- 極簡(jiǎn)主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂