從“流量之爭(zhēng)”到“數(shù)據(jù)之爭(zhēng)” 銀行業(yè)如何打破數(shù)據(jù)孤島?

2021-11-25 17:58:45

金融AI的每一步,大數(shù)據(jù)紅利在左,數(shù)據(jù)隱私安全在右。

“金融機(jī)構(gòu)簡(jiǎn)單將線(xiàn)下業(yè)務(wù)遷移到線(xiàn)上所帶來(lái)的紅利正逐漸消失,競(jìng)爭(zhēng)悄然從互聯(lián)網(wǎng)時(shí)代‘流量之爭(zhēng)’轉(zhuǎn)變?yōu)橐詳?shù)據(jù)要素作為差異化發(fā)展的‘?dāng)?shù)據(jù)之爭(zhēng)’?!?1月23日,中國(guó)工商銀行金融科技研究院聯(lián)合華控清交信息科技(北京)有限公司發(fā)布的《隱私計(jì)算推動(dòng)金融業(yè)數(shù)據(jù)生態(tài)建設(shè)白皮書(shū)》(以下簡(jiǎn)稱(chēng)《白皮書(shū)》)指出,數(shù)據(jù)融合趨勢(shì)日盛,安全保護(hù)呼聲漸漲。作為有效解決計(jì)算過(guò)程中數(shù)據(jù)隱私保護(hù)問(wèn)題的技術(shù)手段之一,隱私計(jì)算技術(shù)受到市場(chǎng)廣泛青睞并蓬勃發(fā)展。隱私計(jì)算核心優(yōu)勢(shì)是分離數(shù)據(jù)所有權(quán)和使用權(quán),開(kāi)創(chuàng) “數(shù)據(jù)特定用途使用權(quán)流通”新范式。

“中國(guó)的大數(shù)據(jù)分布在一個(gè)又一個(gè)的數(shù)據(jù)孤島里,要精準(zhǔn)地為全體中國(guó)消費(fèi)者打破信息不對(duì)稱(chēng),依靠某個(gè)數(shù)據(jù)孤島不行,需要整合各個(gè)數(shù)據(jù)孤島。從大數(shù)據(jù)應(yīng)用行業(yè)分布情況來(lái)看,金融、政府和通信是大數(shù)據(jù)領(lǐng)域投入最多的行業(yè),這三個(gè)行業(yè)貢獻(xiàn)了2020年中國(guó)大數(shù)據(jù)市場(chǎng)38%的規(guī)模?!鳖V强萍级麻L(zhǎng)陳建稱(chēng)。

釋放數(shù)據(jù)潛能

中國(guó)正邁進(jìn)數(shù)字經(jīng)濟(jì)。中國(guó)信通院發(fā)布的《中國(guó)數(shù)字經(jīng)濟(jì)發(fā)展白皮書(shū)》顯示,2020年我國(guó)數(shù)字經(jīng)濟(jì)規(guī)模規(guī)模達(dá)到39.2萬(wàn)億元,占GDP比重為38.6%,已成為國(guó)民經(jīng)濟(jì)的核心增長(zhǎng)極之一。2021年,中國(guó)數(shù)字經(jīng)濟(jì)規(guī)模有望突破40萬(wàn)億元。

中國(guó)金融機(jī)構(gòu)數(shù)字化轉(zhuǎn)型加快。銀保監(jiān)會(huì)數(shù)據(jù)統(tǒng)計(jì),2020年銀行機(jī)構(gòu)信息科技資金總投入為2078億元,同比增長(zhǎng)20%。此外,銀行科技投入占營(yíng)業(yè)收入比重從2%向3%靠近,部分銀行科技投入占比甚至超過(guò)了4%。Gartner預(yù)計(jì),2024年中國(guó)企業(yè)IT支出規(guī)模將達(dá)到2912億美元,年均增速6.04%。其中,銀行業(yè)IT投入居于各行業(yè)前列,預(yù)計(jì)到2024年將達(dá)到431億美元,年均增速5.29%。

“數(shù)據(jù)已成為金融數(shù)字化轉(zhuǎn)型的基礎(chǔ)性、戰(zhàn)略性資源。”中國(guó)人民銀行副行長(zhǎng)范一飛發(fā)表在《金融電子化》2021年10月刊上文章顯示,從“千人千面”的創(chuàng)新產(chǎn)品設(shè)計(jì)到“一人一策”的金融服務(wù)模式,從“去蕪存菁”的業(yè)務(wù)流程優(yōu)化到“除險(xiǎn)保安”的風(fēng)險(xiǎn)安全防控,金融創(chuàng)新發(fā)展始終離不開(kāi)數(shù)據(jù)的有力支撐。金融機(jī)構(gòu)要高度重視數(shù)據(jù)工作,充分釋放數(shù)據(jù)潛能,點(diǎn)燃金融數(shù)字化轉(zhuǎn)型的“數(shù)據(jù)引擎”。

然而,數(shù)據(jù)要素廣泛分布于銀行、互聯(lián)網(wǎng)公司、政府部門(mén)等眾多機(jī)構(gòu)中,它們都有隱私和安全的需求,要釋放數(shù)據(jù)潛能并不容易。

11月1日,《中華人民共和國(guó)個(gè)人信息保護(hù)法》(以下簡(jiǎn)稱(chēng)《個(gè)人信息保護(hù)法》)正式生效,與《民法典》、《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《電子商務(wù)法》、《消費(fèi)者權(quán)益保護(hù)法》等法律共同組成一張公民個(gè)人信息保護(hù)網(wǎng)。作為業(yè)務(wù)鏈路長(zhǎng)而復(fù)雜,業(yè)務(wù)覆蓋零售、公司、金融市場(chǎng)、風(fēng)險(xiǎn)管理等,沉淀了大量的復(fù)雜數(shù)據(jù)資產(chǎn)的機(jī)構(gòu),商業(yè)銀行受到《個(gè)人信息保護(hù)法》的重要影響,而助力銀行數(shù)字化轉(zhuǎn)型的金融科技公司也格外關(guān)注法律對(duì)技術(shù)及業(yè)務(wù)的影響。

11月3日,中國(guó)人民銀行行長(zhǎng)易綱在2021年香港金融科技周上的視頻演講中稱(chēng),中國(guó)人民銀行一直高度重視金融領(lǐng)域的個(gè)人信息保護(hù)工作,2005年以來(lái)在反洗錢(qián)、消費(fèi)者權(quán)益保護(hù)和征信等領(lǐng)域陸續(xù)出臺(tái)了個(gè)人信息保護(hù)相關(guān)制度。近年來(lái),著力治理金融活動(dòng)中對(duì)個(gè)人信息的過(guò)度收集現(xiàn)象,以及不同意提供個(gè)人信息就無(wú)法獲取服務(wù)的“霸王條款”。同時(shí),督促提供金融服務(wù)的各類(lèi)機(jī)構(gòu)嚴(yán)格按照合法、正當(dāng)、最小必要原則收集、使用和保管客戶(hù)信息,規(guī)范機(jī)構(gòu)內(nèi)部為商業(yè)目的使用個(gè)人信息的行為,充分保障消費(fèi)者隱私和合法權(quán)益。未來(lái),中國(guó)人民銀行會(huì)進(jìn)一步完善金融領(lǐng)域個(gè)人信息保護(hù)的法律制度,并加大對(duì)個(gè)人信息保護(hù)的監(jiān)管力度。

《白皮書(shū)》顯示,當(dāng)前,較多金融機(jī)構(gòu)或集團(tuán)仍未實(shí)現(xiàn)數(shù)據(jù)集中,致使客戶(hù)數(shù)據(jù)散落于不同系統(tǒng)、業(yè)務(wù)部門(mén)或法人機(jī)構(gòu),亟待破解生態(tài)內(nèi)外“數(shù)據(jù)孤島”問(wèn)題。特別是對(duì)于交叉營(yíng)銷(xiāo),受數(shù)據(jù)來(lái)源限制,金融機(jī)構(gòu)無(wú)法準(zhǔn)確、全面、實(shí)時(shí)分析客戶(hù)需求及行為偏好,被迫采取“廣而告知”的傳統(tǒng)營(yíng)銷(xiāo)方式, 讓客戶(hù)依據(jù)自身需求選擇產(chǎn)品。此類(lèi)被動(dòng)營(yíng)銷(xiāo)服務(wù)模式的用戶(hù)體驗(yàn)欠佳,金融產(chǎn)品營(yíng)銷(xiāo)和服務(wù)效果有待提升。

陳建表示,打通數(shù)據(jù)孤島、通過(guò)虛擬整合數(shù)據(jù)方式實(shí)現(xiàn)對(duì)消費(fèi)者信貸風(fēng)險(xiǎn)的精準(zhǔn)評(píng)價(jià),金融機(jī)構(gòu)可以決定是否為他們提供金融產(chǎn)品支持,從而可以有效促進(jìn)金融需求和供給實(shí)現(xiàn)平衡,為金融普惠的實(shí)現(xiàn)打下了堅(jiān)實(shí)的基礎(chǔ)。新一代的技術(shù)模式實(shí)現(xiàn)了大數(shù)據(jù)的生產(chǎn)力和數(shù)據(jù)隱私保護(hù)之間的隔離與融合,受到了行業(yè)的肯定。目前,比較主流的方式是將數(shù)據(jù)在不落地、不留痕、不存儲(chǔ)、不傳輸?shù)幕A(chǔ)上進(jìn)行虛擬整合,既充分發(fā)揮數(shù)據(jù)的生產(chǎn)力,又能保護(hù)消費(fèi)者隱私,充分實(shí)現(xiàn)數(shù)據(jù)的可用不可見(jiàn)。

隱私計(jì)算破解難題

“數(shù)據(jù)融合需求日益迫切,保障數(shù)據(jù)要素持有者權(quán)益是實(shí)現(xiàn)數(shù)據(jù)要素有效開(kāi)發(fā)利用的關(guān)鍵。然而,傳統(tǒng)隱私保護(hù)技術(shù)無(wú)法保護(hù)數(shù)據(jù)在計(jì)算過(guò)程中的隱私安全,難以保障數(shù)據(jù)要素持有者權(quán)益不受損害?!薄栋灼?shū)》顯示,隱私計(jì)算技術(shù)因能在保護(hù)數(shù)據(jù)隱私同時(shí)開(kāi)發(fā)利用數(shù)據(jù)價(jià)值,備受各界廣泛關(guān)注。當(dāng)前,行業(yè)重點(diǎn)探索的隱私計(jì)算技術(shù)包括多方安全計(jì)算( Secure Multi-Party Computation,MPC)、聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L )、可信執(zhí)行環(huán)境 (Trusted Execution Environment,TEE)等。

國(guó)外隱私計(jì)算金融應(yīng)用目前尚處于試點(diǎn)階段。長(zhǎng)期以來(lái),北美、歐洲金融監(jiān)管?chē)?yán)格,金融機(jī)構(gòu)對(duì)新技術(shù)引進(jìn)尤為審慎。同時(shí),相關(guān)行業(yè)標(biāo)準(zhǔn)及監(jiān)管規(guī)則尚不明晰,導(dǎo)致隱私計(jì)算技術(shù)在當(dāng)?shù)亟鹑陬I(lǐng)域落地相對(duì)滯緩。國(guó)內(nèi)隱私計(jì)算金融應(yīng)用領(lǐng)先國(guó)際。在頂層設(shè)計(jì)推動(dòng)下, 我國(guó)互聯(lián)網(wǎng)企業(yè)、科技公司及金融機(jī)構(gòu)近年來(lái)相繼研發(fā)多款成型隱私計(jì)算產(chǎn)品,相關(guān)產(chǎn)品呈現(xiàn)平臺(tái)化發(fā)展趨勢(shì),技術(shù)組合應(yīng)用日益明顯。國(guó)內(nèi)示范場(chǎng)景已包含授信風(fēng)控、產(chǎn)品營(yíng)銷(xiāo)、 移動(dòng)支付人臉識(shí)別、跨境結(jié)算、反洗錢(qián)等,其應(yīng)用范圍較國(guó)外更加廣泛、多元。

“隱私計(jì)算是把圍繞數(shù)據(jù)的AI、大數(shù)據(jù)處理和加密等幾種技術(shù)處理手段進(jìn)行了綜合應(yīng)用,也讓數(shù)據(jù)生態(tài)中的數(shù)據(jù)高效、有序、合規(guī)流動(dòng)成為可能,在過(guò)程中實(shí)現(xiàn)金融機(jī)構(gòu)與運(yùn)營(yíng)商或政府等機(jī)構(gòu)數(shù)據(jù)、場(chǎng)景數(shù)據(jù)、同業(yè)等各類(lèi)數(shù)據(jù)源的安全流動(dòng)?!彼{(lán)象智聯(lián)創(chuàng)始人兼CEO徐敏稱(chēng),例如新網(wǎng)銀行和銀聯(lián)數(shù)據(jù)通過(guò)藍(lán)象多方安全技術(shù)來(lái)讓金融機(jī)構(gòu)間查詢(xún)貸款客戶(hù)的多頭信息,無(wú)論是查詢(xún)方的客戶(hù)信息、還是被查詢(xún)方的多頭信息都沒(méi)有明文出域。

“作為加密的分布式機(jī)器學(xué)習(xí)范式,聯(lián)邦學(xué)習(xí)使得各個(gè)僅擁有少量數(shù)據(jù)的參與方之間可以協(xié)同來(lái)完成一個(gè)模型的訓(xùn)練,訓(xùn)練出的模型是基于所有參與方的數(shù)據(jù)達(dá)到的效果,優(yōu)于他們各自獨(dú)立建模的結(jié)果,而參與方之間不泄露各自的原始數(shù)據(jù)?!彼餍胚_(dá)AI創(chuàng)新中心數(shù)據(jù)科學(xué)家邵俊博士稱(chēng),對(duì)于正在全力推進(jìn)數(shù)字化轉(zhuǎn)型的金融業(yè)來(lái)說(shuō),數(shù)據(jù)的價(jià)值毋庸置疑。但AI技術(shù)在金融行業(yè)的應(yīng)用落地,以及在金融行業(yè)大數(shù)據(jù)分析應(yīng)用的過(guò)程中面臨著兩大挑戰(zhàn):一方面,金融客戶(hù)擁有的數(shù)據(jù)難以聚沙成塔取長(zhǎng)補(bǔ)短,數(shù)據(jù)孤島現(xiàn)象普遍存在;另一方面就是數(shù)據(jù)隱私與安全問(wèn)題。而“聯(lián)邦學(xué)習(xí)”成為一種解決金融數(shù)據(jù)壁壘和隱私保護(hù)的有效之道。

邵俊舉例表示,在銀行風(fēng)控場(chǎng)景中,各家銀行擁有不同的客戶(hù)樣本數(shù)據(jù),且數(shù)據(jù)量有限,如果僅僅基于自身的數(shù)據(jù)來(lái)訓(xùn)練模型,受樣本規(guī)模的限制,模型效果難以達(dá)到預(yù)期。如果能將各家數(shù)據(jù)聚合來(lái)訓(xùn)練,則可以大幅提升模型精度。然而出于機(jī)構(gòu)間的競(jìng)爭(zhēng)以及對(duì)數(shù)據(jù)隱私的要求,銀行不可能將自身的客戶(hù)數(shù)據(jù)向任何第三方發(fā)布,直接將各家數(shù)據(jù)聚合到一起建模是行不通的。因此,聯(lián)邦學(xué)習(xí)技術(shù)應(yīng)運(yùn)而生,讓金融機(jī)構(gòu)在不泄露自身原始數(shù)據(jù)的情形下,共同訓(xùn)練機(jī)器學(xué)習(xí)模型提供了可能。

雖然隱私計(jì)算正在金融機(jī)構(gòu)領(lǐng)域蓬勃發(fā)展,但主要集中在銀行業(yè)。北京金融科技產(chǎn)業(yè)聯(lián)盟、成方金融信息技術(shù)服務(wù)有限公司聯(lián)合中國(guó)農(nóng)業(yè)銀行發(fā)布的《隱私計(jì)算金融應(yīng)用調(diào)研報(bào)告》調(diào)查,共收到30家機(jī)構(gòu)的有效問(wèn)卷,其中15家為金融機(jī)構(gòu)(包括銀行、保險(xiǎn)、證券、第三方支付機(jī)構(gòu)等),15家從事金融科技服務(wù)的科技公司。根據(jù)調(diào)查情況,科技公司提供的隱私技術(shù)產(chǎn)品,主要應(yīng)用于銀行業(yè)。

該報(bào)告顯示,金融機(jī)構(gòu)的隱私計(jì)算產(chǎn)品研發(fā)團(tuán)隊(duì)規(guī)模以1-10人區(qū)間居多, 占比為60%,團(tuán)隊(duì)規(guī)模在100人以上的占比僅為7%。而科技公司則以51-100人規(guī)模居多,50人以上規(guī)模占比為 50%。 整體而言,科技公司的隱私計(jì)算研發(fā)團(tuán)隊(duì)規(guī)模明顯超過(guò)金融機(jī)構(gòu),表明科技公司在隱私計(jì)算相關(guān)研發(fā)人才投入上力度更大。

更為關(guān)鍵的是,科技公司在各個(gè)場(chǎng)景應(yīng)用程度比金融機(jī)構(gòu)要更加成熟,該報(bào)告認(rèn)為,一方面是隱私計(jì)算技術(shù)新興程度高,科技公司作為技術(shù)供應(yīng)方對(duì)隱私計(jì)算技術(shù)的探索應(yīng)用相對(duì)積極。另一方面是金融機(jī)構(gòu)在安全性和合規(guī)性方面要求更為嚴(yán)格,符合行業(yè)相關(guān)要求后才推進(jìn)新技術(shù)場(chǎng)景應(yīng)用。金融機(jī)構(gòu)比科技公司認(rèn)為面臨的挑戰(zhàn)更多,但一致認(rèn)為相比于人力、運(yùn)營(yíng)、研發(fā)成本等,目前更多的挑戰(zhàn)來(lái)源于技術(shù)、數(shù)據(jù)、標(biāo)準(zhǔn)、規(guī)則法規(guī)等。

算力挑戰(zhàn)

“從2014年起,金融行業(yè)三個(gè)主要引擎級(jí)變革驅(qū)動(dòng)力分別是計(jì)算、場(chǎng)景和數(shù)據(jù)?!毙烀舴Q(chēng)。

當(dāng)前處于從前沿研究逐漸向金融生產(chǎn)系統(tǒng)落地的關(guān)鍵時(shí)期,隱私計(jì)算當(dāng)前所面臨的算力挑戰(zhàn)也尤為值得關(guān)注。運(yùn)用于金融級(jí)的隱私計(jì)算,勢(shì)必會(huì)面臨跨行業(yè)、大規(guī)模、多模態(tài)的數(shù)據(jù)處理任務(wù),最大程度擴(kuò)展計(jì)算能力,解決性能和通信瓶頸是隱私計(jì)算加速落地首要任務(wù)之一。

《白皮書(shū)》顯示,多方安全計(jì)算涉及用密文轉(zhuǎn)換、密文計(jì)算、密文交換等技術(shù)環(huán)節(jié),算力需求大、處理耗時(shí)長(zhǎng),近年來(lái)其計(jì)算性能雖已大幅度提升,僅達(dá)到明文計(jì)算性能的1/100-1/10。聯(lián)邦學(xué)習(xí)在采用不同方法訓(xùn)練模型、保護(hù)中間參數(shù)時(shí),性能存在差異,目前業(yè)內(nèi)普遍采用的同態(tài)加密等密碼學(xué)方法交換參數(shù)會(huì)引起性能下降??尚艌?zhí)行環(huán)境將密文在硬件環(huán)境內(nèi)解密后計(jì)算, 性能相比純密文計(jì)算更快,但遜于明文計(jì)算,性能主要受限于存儲(chǔ)空間的算力支持水平。差分隱私和數(shù)據(jù)脫敏技術(shù)一般由單個(gè)參與方完成數(shù)據(jù)處理,當(dāng)前性能相對(duì)最高。

“聯(lián)邦學(xué)習(xí)還有一些其他比如數(shù)據(jù)傳輸效率的問(wèn)題。模型訓(xùn)練會(huì)涉及到大量的運(yùn)算,各方聯(lián)合建模就會(huì)涉及到大量的數(shù)據(jù)進(jìn)行交互的問(wèn)題。比如像在梯度下降的時(shí)候,每一步的梯度迭代都會(huì)涉及到通信成本。因此,通信效率是聯(lián)邦學(xué)習(xí)在落地過(guò)程中會(huì)遇到的挑戰(zhàn)。此外,還有像機(jī)構(gòu)與機(jī)構(gòu)之間樣本分布不均衡的問(wèn)題等等?!鄙劭》Q(chēng),聯(lián)邦學(xué)習(xí)的應(yīng)用落地還需要一個(gè)過(guò)程,無(wú)論從技術(shù)上還是行業(yè)生態(tài)上,都還有一些難度,需要業(yè)界不斷加碼投入,推動(dòng)聯(lián)邦學(xué)習(xí)技術(shù)的進(jìn)步和在產(chǎn)業(yè)生態(tài)的落地。

星云Clustar基于研發(fā)團(tuán)隊(duì)在高性能算力、智能網(wǎng)絡(luò)加速等領(lǐng)域的積累,以及對(duì)隱私計(jì)算性能優(yōu)化的深入研究,推出了業(yè)界首款異構(gòu)算力加速方案,以單節(jié)點(diǎn)的算力優(yōu)化和多節(jié)點(diǎn)的通信優(yōu)化解決隱私計(jì)算的計(jì)算壓力與時(shí)延問(wèn)題,實(shí)現(xiàn)50-70倍的算力提升,為隱私計(jì)算大規(guī)模落地場(chǎng)景賦能創(chuàng)造空間。

“星云Clustar希望成為隱私計(jì)算生態(tài)的算力提供者。我們不僅在積極與金融、政務(wù)的行業(yè)客戶(hù)進(jìn)行合作,同時(shí)也會(huì)為云廠商、同行業(yè)合作伙伴開(kāi)放算力服務(wù),共同促進(jìn)高性能隱私計(jì)算的產(chǎn)業(yè)落地,實(shí)現(xiàn)安全、有序、高效的數(shù)據(jù)流通?!毙窃艭lustar方面表示,生態(tài)上,星云Clustar樂(lè)于與各界合作伙伴深度合作,以高性能算力深化隱私計(jì)算產(chǎn)品及服務(wù)易用性、可用性,進(jìn)一步拓展隱私計(jì)算在聯(lián)合風(fēng)控、聯(lián)合營(yíng)銷(xiāo)、數(shù)據(jù)要素流通、銀企融資對(duì)接等各細(xì)分領(lǐng)域的場(chǎng)景落地能力,共同探索數(shù)據(jù)高效連接、流通、應(yīng)用機(jī)制,構(gòu)建起面向未來(lái)的數(shù)據(jù)智能“新基建”,助力產(chǎn)業(yè)基于數(shù)據(jù)驅(qū)動(dòng)的數(shù)智化轉(zhuǎn)型。

(文章來(lái)源:經(jīng)濟(jì)觀察網(wǎng))

標(biāo)簽: 數(shù)據(jù) 流量之爭(zhēng) 數(shù)據(jù)之爭(zhēng) 銀行業(yè) 孤島 紅利 金融 AI 大數(shù)

關(guān)閉
新聞速遞