一種提高人工智能公平性和準(zhǔn)確性的技術(shù)
使機(jī)器學(xué)習(xí)模型的預(yù)測(cè)總體上更準(zhǔn)確的方法可能會(huì)降低代表性不足的子組的準(zhǔn)確性。一種新方法可以提供幫助。對(duì)于使用機(jī)器學(xué)習(xí)模型幫助他們做出決策的工作人員來(lái)說(shuō),知道何時(shí)信任模型的預(yù)測(cè)并不總是那么容易,尤其是因?yàn)檫@些模型通常非常復(fù)雜,以至于它們的內(nèi)部運(yùn)作仍然是個(gè)謎。
用戶有時(shí)會(huì)使用一種稱為選擇性回歸的技術(shù),其中模型估計(jì)每個(gè)預(yù)測(cè)的置信水平,并在其置信度過(guò)低時(shí)拒絕預(yù)測(cè)。然后人類可以檢查這些案例,收集更多信息,并手動(dòng)對(duì)每個(gè)案例做出決定。
但是,雖然選擇性回歸已被證明可以提高模型的整體性能,但麻省理工學(xué)院和MIT-IBMWatsonAI實(shí)驗(yàn)室的研究人員發(fā)現(xiàn),該技術(shù)可能對(duì)數(shù)據(jù)集中代表性不足的人群產(chǎn)生相反的效果。隨著模型的置信度隨著選擇性回歸的增加而增加,其做出正確預(yù)測(cè)的機(jī)會(huì)也會(huì)增加,但這并不總是發(fā)生在所有子組中。
例如,一個(gè)建議貸款批準(zhǔn)的模型平均可能會(huì)產(chǎn)生更少的錯(cuò)誤,但它實(shí)際上可能會(huì)對(duì)黑人或女性申請(qǐng)人做出更多錯(cuò)誤的預(yù)測(cè)。發(fā)生這種情況的一個(gè)原因是模型的置信度度量是使用代表人數(shù)過(guò)多的組進(jìn)行訓(xùn)練的,并且對(duì)于這些代表人數(shù)不足的組可能不準(zhǔn)確。
一旦他們發(fā)現(xiàn)了這個(gè)問(wèn)題,麻省理工學(xué)院的研究人員就開(kāi)發(fā)了兩種算法來(lái)解決這個(gè)問(wèn)題。他們使用真實(shí)世界的數(shù)據(jù)集表明,這些算法減少了影響邊緣化子組的性能差異。
“最終,這是關(guān)于你將哪些樣本交給人類來(lái)處理的更智能。我們希望確保巧妙地考慮跨組的錯(cuò)誤率,而不是僅僅最小化模型的一些廣泛的錯(cuò)誤率,”麻省理工學(xué)院高級(jí)作者、電氣工程和計(jì)算機(jī)科學(xué)系住友工程學(xué)教授GregWornell說(shuō)(EECS),他領(lǐng)導(dǎo)電子研究實(shí)驗(yàn)室(RLE)的信號(hào)、信息和算法實(shí)驗(yàn)室,并且是MIT-IBMWatsonAI實(shí)驗(yàn)室的成員。
加入Wornell的還有共同主要作者AbhinShah(EECS研究生)和YuhengBu(RLE博士后);以及MIT-IBMWatsonAI實(shí)驗(yàn)室的研究人員JoshuaKa-WingLeeSM'17、ScD'21和SubhroDas、RameswarPanda和PrasannaSattigeri。該論文將在國(guó)際機(jī)器學(xué)習(xí)會(huì)議上發(fā)表。
回歸是一種估計(jì)因變量和自變量之間關(guān)系的技術(shù)。在機(jī)器學(xué)習(xí)中,回歸分析通常用于預(yù)測(cè)任務(wù),例如根據(jù)房屋的特征(臥室數(shù)量、平方英尺等)預(yù)測(cè)房屋的價(jià)格。通過(guò)選擇性回歸,機(jī)器學(xué)習(xí)模型可以做出兩種選擇之一對(duì)于每個(gè)輸入——如果它對(duì)其決策沒(méi)有足夠的信心,它可以做出預(yù)測(cè)或放棄預(yù)測(cè)。
當(dāng)模型棄權(quán)時(shí),它會(huì)減少進(jìn)行預(yù)測(cè)的樣本比例,稱為覆蓋率。通過(guò)僅對(duì)它高度自信的輸入進(jìn)行預(yù)測(cè),模型的整體性能應(yīng)該會(huì)提高。但這也會(huì)放大數(shù)據(jù)集中存在的偏差,當(dāng)模型沒(méi)有來(lái)自某些子組的足夠數(shù)據(jù)時(shí),就會(huì)出現(xiàn)偏差。對(duì)于代表性不足的個(gè)人,這可能會(huì)導(dǎo)致錯(cuò)誤或錯(cuò)誤的預(yù)測(cè)。
麻省理工學(xué)院的研究人員旨在確保隨著模型的整體錯(cuò)誤率隨著選擇性回歸的提高而提高,每個(gè)子組的性能也會(huì)得到提高。他們稱之為單調(diào)選擇性風(fēng)險(xiǎn)。
“為這個(gè)特定問(wèn)題提出正確的公平概念是一項(xiàng)挑戰(zhàn)。但是通過(guò)執(zhí)行這個(gè)標(biāo)準(zhǔn),單調(diào)選擇性風(fēng)險(xiǎn),我們可以確保當(dāng)你減少覆蓋范圍時(shí),模型性能實(shí)際上在所有子組中變得更好,”Shah說(shuō)。
一種算法保證模型用于進(jìn)行預(yù)測(cè)的特征包含有關(guān)數(shù)據(jù)集中敏感屬性的所有信息,例如種族和性別,這些信息與感興趣的目標(biāo)變量相關(guān)。敏感屬性是可能不用于決策的特征,通常是由于法律或組織政策。第二種算法采用校準(zhǔn)技術(shù)來(lái)確保模型對(duì)輸入做出相同的預(yù)測(cè),無(wú)論是否將任何敏感屬性添加到該輸入。
研究人員通過(guò)將這些算法應(yīng)用于可用于高風(fēng)險(xiǎn)決策的真實(shí)數(shù)據(jù)集來(lái)測(cè)試這些算法。一是保險(xiǎn)數(shù)據(jù)集,用于使用人口統(tǒng)計(jì)數(shù)據(jù)預(yù)測(cè)向患者收取的年度醫(yī)療費(fèi)用總額;另一個(gè)是數(shù)據(jù)集,用于使用社會(huì)經(jīng)濟(jì)信息預(yù)測(cè)社區(qū)中的暴力數(shù)量。兩個(gè)數(shù)據(jù)集都包含個(gè)人的敏感屬性。
當(dāng)他們?cè)谟糜谶x擇性回歸的標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)方法之上實(shí)施他們的算法時(shí),他們通過(guò)降低每個(gè)數(shù)據(jù)集中少數(shù)子組的錯(cuò)誤率來(lái)減少差異。此外,這是在沒(méi)有顯著影響整體錯(cuò)誤率的情況下完成的。
“我們看到,如果我們不施加某些限制,在模型非常自信的情況下,它實(shí)際上可能會(huì)犯更多錯(cuò)誤,這在某些應(yīng)用中可能會(huì)非常昂貴,例如醫(yī)療保健。因此,如果我們扭轉(zhuǎn)趨勢(shì)并使其更直觀,我們會(huì)發(fā)現(xiàn)很多這樣的錯(cuò)誤。這項(xiàng)工作的一個(gè)主要目標(biāo)是避免錯(cuò)誤被悄無(wú)聲息地發(fā)現(xiàn),”Sattigeri說(shuō)。
Shah說(shuō),研究人員計(jì)劃將他們的解決方案應(yīng)用于其他應(yīng)用程序,例如預(yù)測(cè)房?jī)r(jià)、學(xué)生GPA或貸款利率,以查看算法是否需要針對(duì)這些任務(wù)進(jìn)行校準(zhǔn)。他們還想探索在模型訓(xùn)練過(guò)程中使用不太敏感信息的技術(shù),以避免隱私問(wèn)題。
他們希望改進(jìn)選擇性回歸中的置信度估計(jì),以防止模型置信度低但預(yù)測(cè)正確的情況。Sattigeri說(shuō),這可以減少人類的工作量并進(jìn)一步簡(jiǎn)化決策過(guò)程。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 借用外帶杯蓋的形狀無(wú)人機(jī)機(jī)翼可以學(xué)習(xí)如何更快地感知危險(xiǎn)
- 可以感覺(jué)到布料層的機(jī)器人有一天可能會(huì)幫助洗衣服
- 半導(dǎo)體生產(chǎn)廢水處理新技術(shù)的開(kāi)發(fā)
- Meta吹捧只翻譯口語(yǔ)的人工智能
- 使用模型和深度學(xué)習(xí)改進(jìn)人體皮膚的映射
- 為目標(biāo)檢測(cè)技術(shù)開(kāi)發(fā)的新人工智能框架
- 研究評(píng)估了用于VR耳機(jī)的免提文本選擇系統(tǒng)的功效
- 使用機(jī)器學(xué)習(xí)從匿名手機(jī)數(shù)據(jù)中提取個(gè)人信息
-
安徽淮南長(zhǎng)安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級(jí)。對(duì)于想要購(gòu)買這款車的消...瀏覽全文>>
-
安徽阜陽(yáng)的大眾高爾夫GTI作為一款備受年輕消費(fèi)者喜愛(ài)的性能車型,其價(jià)格和配置一直是大家關(guān)注的重點(diǎn)。高爾夫GT...瀏覽全文>>
-
近年來(lái),新能源汽車市場(chǎng)發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國(guó)內(nèi)市場(chǎng)上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時(shí)尚的外觀設(shè)計(jì)和實(shí)用的配置,吸引了眾多消費(fèi)者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場(chǎng)的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費(fèi)者的關(guān)注。作為一款高端插電式混合動(dòng)力SUV,...瀏覽全文>>
-
近年來(lái),隨著新能源汽車的普及和政策支持的不斷加大,越來(lái)越多消費(fèi)者將目光投向了插電混動(dòng)車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費(fèi)者的目光。在購(gòu)...瀏覽全文>>
-
長(zhǎng)安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來(lái),新能源汽車市場(chǎng)持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費(fèi)者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過(guò)iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當(dāng)你看到T-Mobile用戶贏得手機(jī)手表和耳機(jī)時(shí)你會(huì)羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強(qiáng)的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強(qiáng)大的159美元UBoomX便攜式揚(yáng)聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機(jī)型扭轉(zhuǎn)了之前的趨勢(shì)
- Waze迎來(lái)魔獸世界改版
- SquareEnix將心愛(ài)的RPG移植到MetaQuest3
- 蘋果正在設(shè)計(jì)全新操作系統(tǒng)瞄準(zhǔn)新類別的產(chǎn)品
- 小米R(shí)edmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價(jià),各配置車型售價(jià)一目了然
- 生活家PHEV多少錢?購(gòu)車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗(yàn)卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價(jià)格2025款,各配置車型售價(jià)全揭曉,性價(jià)比之王
- 淮北途觀L多少錢 2025款落地價(jià),價(jià)格再創(chuàng)新低,性價(jià)比爆棚
- 山東濟(jì)南帕薩特新能源新款價(jià)格2025款多少錢?最低售價(jià)17.715萬(wàn)起,性價(jià)比大揭秘
- SWM斯威G01FF新款價(jià)格2024款多少錢?看完這篇購(gòu)車攻略再做決定
- 淮南ID.4 X價(jià)格,最低售價(jià)13.9888萬(wàn)起,價(jià)格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價(jià)與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機(jī)其價(jià)格低于摩托羅拉Razr2024
- OnePlus13型號(hào) 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運(yùn)動(dòng)相機(jī)競(jìng)爭(zhēng)對(duì)手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無(wú)線控制器系列2通過(guò)Xbox設(shè)計(jì)實(shí)驗(yàn)室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價(jià)更高
- 谷歌終止PixelBuds的點(diǎn)擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對(duì)AppleIntelligence功能的評(píng)價(jià)從一般到還可以
- GalaxyS25Plus看起來(lái)很時(shí)髦但三星是否選擇像iPhone一樣的通用設(shè)計(jì)
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價(jià)同時(shí)贈(zèng)送100美元Xbox禮品卡和1年保護(hù)計(jì)劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價(jià)格
- Valve出售部分SteamDeck型號(hào)-GBLCD型號(hào)售價(jià)296.65美元512GBLCD型號(hào)售價(jià)336.75美元
- Beats在其產(chǎn)品線中增加了手機(jī)保護(hù)殼推出適用于iPhone16系列的MagSafe保護(hù)殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡(jiǎn)單地與之交談就像ChatGPT一樣
- 極簡(jiǎn)主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂