
這是一個金融機構(gòu)欲言又止的領域。
隨著互聯(lián)網(wǎng)消費金融的興起,不依賴線下營業(yè)網(wǎng)點,僅通過線上實現(xiàn)展業(yè)放貸,這一“輕模式”不僅快速推廣開來,也受到資本市場等的追捧。
一位騰訊資深風控人士表示,互聯(lián)網(wǎng)消費信貸的特征一是“快”:線上化、非接觸、場景化、秒批秒放。二是“白”,客群缺少征信信息。他表示,以2016年來看,估算消費信貸市場規(guī)模約為6.6萬億,其中不良信貸規(guī)模超過2000億元。
與傳統(tǒng)銀行信貸相比,互聯(lián)網(wǎng)信貸呈現(xiàn)不同的特征。此前,央行總行金融市場司副處長、百行征信顧問唐磊此前接受21世紀經(jīng)濟報道記者采訪時表示,互聯(lián)網(wǎng)金融和消費金融機構(gòu)產(chǎn)品模式比傳統(tǒng)金融機構(gòu)更為復雜。如較常見的循環(huán)貸、聯(lián)合貸等產(chǎn)品,前者給予借款人一定額度可多次借貸,后者為多家機構(gòu)聯(lián)合給借款人放貸?;ヂ?lián)網(wǎng)貸款呈現(xiàn)小額、快速、高頻特征,市場上存在大量秒批、十幾分鐘就要放款的產(chǎn)品。新金融展業(yè)對征信數(shù)據(jù)的查詢速度要求較快,有的互金機構(gòu)要求服務器毫秒級反應,數(shù)據(jù)期限T+1隔日信息。
這使得互聯(lián)網(wǎng)金融類機構(gòu)以不同的模式從事展業(yè)。上述風控人士表示,大數(shù)據(jù)風控三要素中,數(shù)據(jù)決定了風控的天花板,決策引擎決定了接近天花板的程度,計算平臺決定了研發(fā)的效率。
需要搜集哪些數(shù)據(jù)?
包括傳統(tǒng)銀行、持牌消費金融機構(gòu)、互聯(lián)網(wǎng)金融機構(gòu)等,均已大量從事互聯(lián)網(wǎng)信貸。21世紀經(jīng)濟報道記者根據(jù)各互聯(lián)網(wǎng)信貸產(chǎn)品的用戶借款協(xié)議、隱私協(xié)議等梳理,這些線上放貸的產(chǎn)品所需要的數(shù)據(jù)一般包括個人信息、手機設備信息、征信信息、聯(lián)系人信息等。
互聯(lián)網(wǎng)巨頭中,包括百度、阿里巴巴、京東、小米等一般將互聯(lián)網(wǎng)信貸產(chǎn)品的隱私權(quán)協(xié)議與母公司賬戶體系打通,利用其在體系內(nèi)手機的數(shù)據(jù)核算個人信貸額度。
螞蟻金服的“花唄”要求讀取支付寶、銀行、商戶等留存的姓名、證件類型及號碼、聯(lián)系電話及地址、支付寶賬戶信息、履約情況;芝麻信用等信用報告;政府機構(gòu)、司法機關及公共事業(yè)單位、行業(yè)組織(法院、中國互聯(lián)網(wǎng)金融協(xié)會)等的信息,如訴訟信息;關聯(lián)人姓名及聯(lián)系方式等。
百度“有錢花”與百度賬號體系打通,收集的個人賬戶信息包括:設備信息、設備位置、設備連接、設備狀態(tài)、日志信息、位置信息、唯一應用程序編號、本地存儲、Cookie和匿名標示符等工具。其中,設備信息包括硬件型號、操作系統(tǒng)版本、設備配置、唯一設備標識符、國際移動設備身份碼IMEI、網(wǎng)絡設備硬件地址MAC、廣告標識符IDFA等。設備位置信息包括:通過GPS、藍牙或WIFI信號獲得的位置信息。設備連接信息:瀏覽器的類型、電信運營商、使用的語言等。設備狀態(tài)信息包括:設備傳感器數(shù)據(jù),設備應用安裝列表。日志信息包括:使用情況、IP地址、所訪問服務的URL、瀏覽器的類型等。位置信息包括:IP地址、GPS、Wi-Fi接入點、基站等信息。
部分互聯(lián)網(wǎng)金融機構(gòu)則強制要求App讀取某些權(quán)限,否則無法正常打開App或提示可能無法正常使用。
如小米貸款App要求獲取設備信息(IMEI、MAC地址)等。其收集的信息包括設備信息、應用信息、位置信息、登錄日志信息等。設備信息包括:IMEI編號、IMSI編號、MAC地址、序列號、MIUI版本、安卓版本、屏幕顯示信息、設備輸入信息、設備制造商信息和型號名稱、網(wǎng)絡運營商、連接類型、硬件使用情況(電量、設備溫度等)。應用信息包括:應用列表、狀態(tài)記錄、應用ID、SDK版本、系統(tǒng)更新設置。位置信息包括:地區(qū)、國家代碼、城市代碼、移動網(wǎng)絡代碼、移動國家代碼、小區(qū)代碼、經(jīng)緯度信息、時區(qū)設置和語言設置。登錄日志信息包括:Cookie、IP、網(wǎng)絡請求、臨時消息、標準系統(tǒng)日志、錯誤崩潰信息。其他信息包括:環(huán)境特征值(ECV)(小米賬號、設備標識、鏈接WiFi產(chǎn)生的信息和地理位置)。
招聯(lián)金融App要求必須讀取存儲空間、撥打和管理電話權(quán)限。在數(shù)據(jù)搜集上,包括在央行征信、公安、公積金、社保、稅務、民政、物流、通信運營商、電子商務平臺、互聯(lián)網(wǎng)社交平臺等平臺上查詢個人征信、財產(chǎn)信息、聯(lián)絡方式、關系人、資信情況、就業(yè)情況、收入情況、婚姻情況、學歷情況、工作地址、居住地址、位置數(shù)據(jù)、通信行為、通訊信息、互聯(lián)網(wǎng)使用信息、互聯(lián)網(wǎng)使用行為等。
中原消費金融App要求必讀讀取設備信息權(quán)限、設備存儲權(quán)限、定位信息等。收集的數(shù)據(jù)包括:在白騎士大數(shù)據(jù)、鵬元征信、芝麻信用、中智誠征信、北京集奧聚合、上海誠數(shù)等平臺查詢身份信息、行為信息、交易信息、設備信息等。
剛剛在港上市的51信用卡搜集的數(shù)據(jù)包括:導入銀行賬單、手機號、瀏覽器和手機信息、IP、訪問日期和時間、軟硬件等特征信息;身份信息、聯(lián)系地址、職業(yè)信息、聯(lián)系人聯(lián)系方式、歷史借貸情況、設備及位置信息、通話記錄及短信記錄等。
用戶畫像標簽
搜集數(shù)據(jù)的目的,在于獲取用戶畫像。
京東金融明確提出,收集用戶身份信息、銀行卡信息、手機號、個人基本信息、身份信息、財產(chǎn)信息、交易信息及行為信息、瀏覽信息、關注信息、軟件信息、設備信息等,進行數(shù)據(jù)分析以形成用戶畫像,用來展示用戶感興趣的產(chǎn)品或服務信息。
21世紀經(jīng)濟報道記者調(diào)查獲悉,在擁有全面、海量數(shù)據(jù)的基礎上,金融機構(gòu)會對數(shù)據(jù)進行分類。一般而言,互聯(lián)網(wǎng)機構(gòu)和金融機構(gòu)會通過豐富和全面的標簽體系,采用成千上萬個動態(tài)或靜態(tài)字段信息。
例如:平安集團大數(shù)據(jù)平臺中的數(shù)據(jù)規(guī)模高達8.5PB,單個用戶數(shù)據(jù)標簽達20000個。
騰訊的用戶畫像中,標記在每個用戶身上的標簽人均2000多個,大概可以歸類為賬戶數(shù)據(jù)、交易數(shù)據(jù)、商戶數(shù)據(jù)、QQ平臺數(shù)據(jù)、微信平臺數(shù)據(jù)、安全平臺數(shù)據(jù),日均計算量達到1.5萬億次。不過,騰訊旗下微眾銀行的微粒貸,用于風控的標簽此前不超過40個,在近期增加兩個與郵箱相關的標簽后,也僅有42個。
通過這一標簽系統(tǒng),將散亂無章的數(shù)據(jù)整理為清晰分層、邏輯清楚的結(jié)構(gòu)化數(shù)據(jù),從而可以被大數(shù)據(jù)風控模型所用。