神經(jīng)網(wǎng)絡(luò)使用銀行交易數(shù)據(jù)進(jìn)行信用評(píng)分
來(lái)自 Skoltech 和一家主要?dú)W洲銀行的研究人員開(kāi)發(fā)了一種神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)在使用交易銀行數(shù)據(jù)進(jìn)行客戶信用評(píng)分方面優(yōu)于現(xiàn)有的最先進(jìn)解決方案。該研究發(fā)表在 2020 年 IEEE 數(shù)據(jù)挖掘國(guó)際會(huì)議 (ICDM) 的論文集上。
機(jī)器學(xué)習(xí)算法已經(jīng)廣泛用于風(fēng)險(xiǎn)管理,幫助銀行評(píng)估客戶及其財(cái)務(wù)狀況。“現(xiàn)代人,尤其是銀行客戶,不斷在數(shù)字世界中留下痕跡。例如,客戶可以在支付系統(tǒng)中添加有關(guān)向另一個(gè)人轉(zhuǎn)賬的信息。因此,每個(gè)人都會(huì)獲得大量可以表示為有向圖的連接。這樣的圖表為客戶的評(píng)估提供了額外的信息。有效處理和使用有關(guān)客戶端之間連接的豐富異構(gòu)信息是我們研究背后的主要思想,”作者寫(xiě)道。
統(tǒng)計(jì)機(jī)器學(xué)習(xí)小組的負(fù)責(zé)人 Maxim Panov 和來(lái)自 Skoltech 的 Kirill Fedyanin 及其同事能夠證明,與僅使用目標(biāo)客戶數(shù)據(jù)的算法相比,使用客戶之間的資金轉(zhuǎn)移數(shù)據(jù)可以顯著提高信用評(píng)分的質(zhì)量. 這將有助于為值得信賴的客戶提供更好的報(bào)價(jià),同時(shí)降低欺詐活動(dòng)的負(fù)面影響。
“特定銀行客戶的定義屬性之一是他或她與其他人的社交和財(cái)務(wù)互動(dòng)。它促使我們將銀行客戶視為一個(gè)相互關(guān)聯(lián)的代理網(wǎng)絡(luò)。因此,這項(xiàng)研究的目標(biāo)是找出著名的諺語(yǔ)“告訴我你的朋友是誰(shuí),我會(huì)告訴你你是誰(shuí)”是否適用于金融代理人,”帕諾夫說(shuō)。
他們的邊權(quán)重共享圖卷積網(wǎng)絡(luò) (EWS-GCN) 使用圖來(lái)聚合來(lái)自它們的信息并預(yù)測(cè)目標(biāo)客戶的信用評(píng)級(jí),其中節(jié)點(diǎn)對(duì)應(yīng)于銀行客戶的匿名標(biāo)識(shí)符,邊是它們之間的交互。新方法的主要特點(diǎn)是能夠按原樣處理出現(xiàn)在銀行數(shù)據(jù)中的大規(guī)模時(shí)間圖,即沒(méi)有任何通常很復(fù)雜并導(dǎo)致數(shù)據(jù)中包含的信息部分丟失的預(yù)處理。
研究人員對(duì)六個(gè)模型進(jìn)行了廣泛的實(shí)驗(yàn)比較,EWS-GCN 模型的表現(xiàn)優(yōu)于所有競(jìng)爭(zhēng)對(duì)手。“該模型的成功可以通過(guò)三個(gè)因素的結(jié)合來(lái)解釋。首先,該模型直接處理豐富的交易數(shù)據(jù),從而最大限度地減少其中包含的信息丟失。其次,模型的結(jié)構(gòu)經(jīng)過(guò)精心設(shè)計(jì),使模型具有表現(xiàn)力并有效地參數(shù)化,最后,我們?yōu)檎麄€(gè)管道提出了特殊的訓(xùn)練程序,”Panov 指出。
他還說(shuō),要在銀行實(shí)踐中使用該模型,它必須非??煽?。“復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型受到對(duì)抗性攻擊的威脅,由于我們對(duì)這種現(xiàn)象缺乏與我們的模型相關(guān)的知識(shí),我們目前無(wú)法在生產(chǎn)過(guò)程中使用它,將其留待進(jìn)一步研究,”Panov 總結(jié)道。
標(biāo)簽: