97成人免费视频,97视频免费公开成人福利,免费视频99,99婷婷,国产伊人久久,亚洲视频欧美,国产精品福利久久

首頁(yè) > 專(zhuān)題 > 文思海輝-乘數據之舟-達價(jià)值彼岸 > 數據分析之道--銀行業(yè)數據挖掘分析的現狀與前瞻(西安站)

數據分析之道--銀行業(yè)數據挖掘分析的現狀與前瞻(西安站)
2014-11-28 11:55:05   評論:0 點(diǎn)擊:

  隨著(zhù)中國金融市場(chǎng)的快速發(fā)展,互聯(lián)網(wǎng)金融對傳統金融行業(yè)的競爭,以及監管力度的不斷加強,IT咨詢(xún)服務(wù)公司對金融企業(yè)的商業(yè)智能方案也面臨不斷創(chuàng )新。如何提升金融機構在管理、盈利、風(fēng)險控等多方位的能力?如何將國際經(jīng)驗更好的為中國市場(chǎng)服務(wù)?如何通過(guò)解決方案將海量數據轉化為對經(jīng)營(yíng)決策有價(jià)值的信息之路?如何將客戶(hù)智能分析成果行之有效地運用于服務(wù)渠道,并最終轉換為銷(xiāo)售業(yè)績(jì)?為解決中國金融機構在發(fā)展中所面臨的新問(wèn)題,文思海輝在西安、蘇州、北京、成都、深圳五地舉辦了6場(chǎng)“乘數據之舟,達價(jià)值彼岸”系列活動(dòng)。

  在主題為“乘數據之舟,達價(jià)值彼岸”的文思海輝商業(yè)智能解決方案系列研討會(huì )西安站現場(chǎng),文思海輝商業(yè)智能事業(yè)部高級經(jīng)理馬寧做了“數據分析之道--銀行業(yè)數據挖掘分析的現狀與前瞻”主題演講。



文思海輝商業(yè)智能事業(yè)部高級經(jīng)理 馬寧

  以下為演講實(shí)錄:

  大家好最后一個(gè)議題,也是最時(shí)髦的議題,關(guān)于銀行業(yè)的數據挖掘。這張片子不知道大家是不是第一次見(jiàn),但我敢保證肯定不是你們最后一次看這張片子及接下來(lái)的兩張片子,業(yè)內會(huì )把數據分析分成八個(gè)等級,前四個(gè)等級是驗證性的,我們的目的是了解過(guò)去,而后四個(gè)等級和更高等級是預測性的,它用來(lái)發(fā)現未來(lái),驗證型的包含普通的報表,查詢(xún)預警風(fēng)險,發(fā)掘型的是一些更深的比如統計分析,時(shí)間序列的分析,去建一些預測模型,以及最復雜的形式,我們會(huì )用一些運籌學(xué)的知識做流程優(yōu)化。

  數據挖掘我們在執行時(shí)始終遵循BM的執行方法論,它包含六個(gè)主要步驟,從業(yè)務(wù)理解到數據理解,數據準備,建立模型評估模型,最終部屬這個(gè)模型。

  先來(lái)看業(yè)務(wù)理解,我們銀行最常見(jiàn)的信用卡產(chǎn)品,來(lái)看整個(gè)客戶(hù)的生命周期,產(chǎn)品周期是怎樣的,下面是隨著(zhù)生命周期的演進(jìn),客戶(hù)價(jià)值的曲線(xiàn),我們一開(kāi)始在獲取這個(gè)客戶(hù)的時(shí)候,是付出成本的過(guò)程,客戶(hù)是附加值,隨著(zhù)客戶(hù)逐漸成熟,價(jià)值在提升達到他的峰值,有可能客戶(hù)會(huì )流失或者發(fā)生一些違約欺詐行為,導致客戶(hù)最終的價(jià)值又變?yōu)榈母郊又担谡麄(gè)過(guò)程中,上面列出來(lái)的是業(yè)務(wù)所關(guān)注的各個(gè)視角,而下面是數據挖掘在每個(gè)過(guò)程中輔助業(yè)務(wù)做出的各種量化判斷與分析。我在這里會(huì )把所有數據挖掘的專(zhuān)題分成營(yíng)銷(xiāo)類(lèi)風(fēng)險管理類(lèi)的,剛才劉密和宋楊兩人提到的兩大類(lèi)型。營(yíng)銷(xiāo)類(lèi)關(guān)注的是我怎么更好的獲取客戶(hù),了解客戶(hù),給他們賣(mài)更多的產(chǎn)品,幫助我更好的盈利,風(fēng)險類(lèi)的無(wú)外乎客戶(hù)的申請評分,行為評分,欺詐管理等等防范銀行的風(fēng)險,我們把營(yíng)銷(xiāo)展開(kāi)來(lái)看,數據挖掘這一層在整個(gè)營(yíng)銷(xiāo)層中中間地位,它承接了數據層的數據,為營(yíng)銷(xiāo)的決策提供營(yíng)銷(xiāo)客戶(hù)名單,以及基于這個(gè)名單的具體實(shí)施流程,主要包含了客戶(hù)細分,營(yíng)銷(xiāo)預測等等。

  風(fēng)險管理第一大部分是基于巴塞爾框架,有信用風(fēng)險,市場(chǎng)風(fēng)險操作風(fēng)險以及流動(dòng)性風(fēng)險,上面每一個(gè)領(lǐng)域我們研究的主題對象是什么,下面是我們用挖掘模型去量化的一些具體的指標和專(zhuān)題是什么,同樣在反欺詐里面也會(huì )做數據挖掘的模型,做時(shí)時(shí)的檢測和行為分析。這里面我列出來(lái)了某家銀行他們目前在建的所有的和數據挖掘有關(guān)的模型情況,基本上是符合我們剛才介紹的框架,零售做營(yíng)銷(xiāo)類(lèi)的,兩個(gè)風(fēng)險部門(mén)做具體的信用風(fēng)險和流動(dòng)性風(fēng)險的各種模型,信用卡中心單獨做風(fēng)險ABC卡,以及營(yíng)銷(xiāo)的客戶(hù)分群和營(yíng)銷(xiāo)預測。使用到的產(chǎn)品和市場(chǎng)上主流的SPSS這樣的工具。

  看第二步關(guān)于數據的理解,我們要做一個(gè)客戶(hù)的營(yíng)銷(xiāo),一定要了解你的客戶(hù),客戶(hù)具有什么樣的屬性,是做客戶(hù)模型的重中之重,我們提倡建立客戶(hù)的360度的試圖,其中灰色字的部分是我們行內比較具備的數據,而黃色字的部分是我們比較欠缺的需要收集的部分,行內現有的數據真的足以支撐對客戶(hù)360度的分析嗎?首先我們來(lái)看行內是有自己數據壁壘的,出于安全敏感性的考慮,各個(gè)部門(mén)的數據可能不能充分的共享,各個(gè)系統之間有對接的成本,以及數據質(zhì)量帶來(lái)的各種問(wèn)題,同時(shí)行內的數據其實(shí)是非常非常局限的客戶(hù)視角,我們只看到了客戶(hù)的金融屬性,你看到客戶(hù)買(mǎi)一雙鞋,你不知道客戶(hù)為什么買(mǎi)這雙鞋,同時(shí)第三方支付平臺的出現,使得連我們最后客戶(hù)買(mǎi)這雙鞋這個(gè)事情都不知道,就知道他花了二百塊錢(qián),所以現在一些大銀行在探討如何拓展行內的數據以及銜接行外的數據,去獲取更多客戶(hù)信息,互聯(lián)網(wǎng)上提供了大量這方面的信息,餐飲的,購物的房產(chǎn)以及綜合類(lèi)的信息,很多銀行在嘗試建立自己的電商平臺,把自己的非結構化數據項結構化數據轉換,以及利用API去互聯(lián)網(wǎng)上爬數據,和其它的數據提供方進(jìn)行合作。

  有了這些數據之后,我們終于可以開(kāi)始進(jìn)行數據的準備,打算建立一個(gè)挖掘模型,傳統的數據準備這種架構,從我的數據存儲平臺ODS數倉遷移到數據分析平臺SPSS,在這里面做基礎的數據加工,遵循八二原則,會(huì )有80%的數據拼接匯總在這里充分利用數倉的優(yōu)勢完成。具體的統計過(guò)程相關(guān)的數據處理剩下的20%在數據挖掘平臺來(lái)執行,這樣的問(wèn)題是有大量的建模數據,有一個(gè)遷移的過(guò)程,現在一個(gè)大的趨勢就是存儲節點(diǎn)與計算節點(diǎn)的融合,數據在哪里存儲就在哪里結算,比如一些庫內計算的框架,以及大數據hadoop這樣的平臺上都是這樣的平臺,直接操作,把中間結果保存于內存中,數據處理的效果更高。

  接下來(lái)模型這里面簡(jiǎn)單挪列了一下數據挖掘經(jīng)常會(huì )遇到的模型,時(shí)間的原因我們不仔細展開(kāi)講,大致四類(lèi),分類(lèi)模型,回歸模型,聚類(lèi)模型以及數據建緯的一些算法,分別用于解決不同的問(wèn)題,我們做的最常見(jiàn)的其實(shí)是預測模型,預測模型就是我拿到很多歷史數據,我如何根據歷史數據來(lái)預測未來(lái),舉一個(gè)簡(jiǎn)單例子,我現在要判斷一個(gè)企業(yè)它的違約概率,剛才說(shuō)的PD模型,我收集了它歷史上2006年到2012年的數據,因為現在2014年了,2013年發(fā)生違約我是知道的,我在這里面希望找到一個(gè)函數關(guān)系,把收集的數據財務(wù)指標,帳戶(hù)行為影射到最后的違約概率上來(lái),一個(gè)最簡(jiǎn)單的模型,比如他是房地產(chǎn)業(yè),房地產(chǎn)業(yè)這幾年被限制,所以它的違約概率會(huì )高一些,如果不是房地產(chǎn)業(yè),違約概率低一些,非常粗糙的模型,確實(shí)是一個(gè)數據挖掘的模型,我如果找到這樣的關(guān)系,我可以做預測,如果時(shí)間往后退一年,2007到2013年的數據我已經(jīng)收集齊了,到2014年這家行業(yè)就可以利用這個(gè)公式算他的違約概率是多少,這就是最簡(jiǎn)單的預測模型的例子。

  模型做好之后,下一步是模型部屬上線(xiàn),我們這里不談模型的技術(shù)部屬,模型的評估兩方面,一方面從統計指標評估,是不是符合我們的要求,有各種各樣檢驗指標,準確性、違約性等等,另一方面看這樣的模型從業(yè)務(wù)上是否有可應用的能力,比如它得到的結果是不是符合業(yè)務(wù)上的主觀(guān)認知和業(yè)務(wù)經(jīng)驗,它使用的變量有沒(méi)有政策法律風(fēng)險,比如說(shuō)我去做一張信用卡評分模型,會(huì )發(fā)現在美國黑人他的違約率很高的,但是我們把膚色這個(gè)變量方進(jìn)模型肯定是不行的,會(huì )帶來(lái)各種各樣的法律問(wèn)題。

  最后模型的部屬,模型做好是要上線(xiàn)應用的,我們的應用模式有這么幾種,一種打標簽給客戶(hù)做聚類(lèi),通過(guò)客戶(hù)的各種屬性分成各種各樣的類(lèi)型,甚至一個(gè)客戶(hù)有多種標簽,將來(lái)搞營(yíng)銷(xiāo)活動(dòng)的話(huà),我從中優(yōu)選到底推送美食愛(ài)好者,還是推送給網(wǎng)購達人,另一種模式我們給客戶(hù)做批量評分,這里面我算一下我客戶(hù)的流失率是多少,算流失率具體的數值0到1之間,也會(huì )估算一下如果客戶(hù)流失,他目前的資產(chǎn)是多少,流失以后行業(yè)有可能造成資產(chǎn)損失是多少,拿到這么一個(gè)龐大流失名單以后,我們怎么挽留這些客戶(hù),我們挽留誰(shuí),甚至我們可以算一下,每一個(gè)客戶(hù)如果說(shuō)我要挽留他的話(huà),花費一個(gè)單位的成本,如果一個(gè)客戶(hù)其實(shí)不會(huì )流失,我就白白挽留他了,一個(gè)成本掏出去之后,是一個(gè)準成本,但如果一個(gè)客戶(hù)真的會(huì )流失,我如果成功留住,雖然我留住這個(gè)客戶(hù)的概率是0.3%,但是這個(gè)人如果留住他會(huì )給我帶來(lái)20單位的價(jià)值的話(huà),進(jìn)去一個(gè)單位的挽留成本,我會(huì )掙五塊錢(qián),雖然這也是一個(gè)比較粗糙的估算,但是我就可以知道,這個(gè)名單上前百分之多少的客戶(hù)我把他挽留住,能給我帶來(lái)整個(gè)銀行效益的最大化,這是實(shí)際做的例子,告訴我們某家銀行私人銀行的客戶(hù),我們建議他按照這個(gè)名單從高到低的概率排序的話(huà),建議他挽留前9.7%的客戶(hù)。

  除了挖掘出名單之后,同樣的對這個(gè)名單業(yè)務(wù)的執行是非常重要的,這也是我們實(shí)際案例的數據,我們在某家銀行三個(gè)分行里面搞產(chǎn)品營(yíng)銷(xiāo),我怎么知道最后營(yíng)銷(xiāo)效果好壞,是我的模型做的好與不好,還是我這個(gè)名單到客戶(hù)經(jīng)理那邊以后,他的執行是有利的,還是不利的,我們這樣做,我們把對照組是隨機的客戶(hù)名單,而不是挖掘的客戶(hù)名單,讓他交給客戶(hù)執行,既是挖掘名單又有客戶(hù)經(jīng)理執行,就是簡(jiǎn)單的挖掘名單,我們關(guān)注這些人,對他進(jìn)行營(yíng)銷(xiāo),到時(shí)候每組的簽約率可以算出比值,這個(gè)比值就可以知道到底是執行的問(wèn)題,還是算法。

  在大數據時(shí)代能看到這是麥肯錫在2013年對各個(gè)行業(yè)大數據應用前景做的調查,他認為銀行業(yè)這個(gè)橫軸指使用大數據所帶來(lái)的價(jià)值和潛力,縱軸代表這個(gè)行業(yè)收集大數據的可行性,顏色代表這個(gè)行業(yè)內部的競爭壓力,以及圓形的大小代表這個(gè)行業(yè)對美國GDP的貢獻,可以看到銀行業(yè)是處在正張圖的最右上角,因此銀行業(yè)是我們將來(lái)使用大數據最重要的領(lǐng)域之一。有了大數據之后,我們的客戶(hù)試圖更加完善,我們更加了解我們的客戶(hù),再做傳統客戶(hù)分析模型時(shí),我們可以從更多的視角了解我們的客戶(hù),而不是簡(jiǎn)單的以前的傳統很枯燥的做法,我可以知道我的客戶(hù)他家周?chē)卸嗌偌移渌y行的網(wǎng)點(diǎn),如果新開(kāi)一些其它銀行網(wǎng)點(diǎn),會(huì )不會(huì )導致流失,都會(huì )成為我們考慮的因素。

  一些國際上領(lǐng)先的銀行,已經(jīng)開(kāi)始嘗試使用大數據技術(shù)對客戶(hù)進(jìn)行深入研究,他們會(huì )記錄客戶(hù)每次消費地點(diǎn),客戶(hù)經(jīng)常去的地方,來(lái)看客戶(hù)是否經(jīng)常外出吃飯,是否為了一個(gè)打折商品,犧牲距離去很遠商場(chǎng)買(mǎi)東西等等,他們這樣精細的記錄客戶(hù)的行為,是為了把客戶(hù)細分,再細分,甚至細分到一個(gè)人,一個(gè)人做精細化的營(yíng)銷(xiāo),其它的一些項目花旗銀行他使用了文本分析技術(shù),去了解客戶(hù)在社交網(wǎng)絡(luò )上,提供了各種對銀行產(chǎn)品服務(wù)的個(gè)種信息,這是一個(gè)三方的評級公司,他們研究客戶(hù)的信用指數與他的一些習慣,姓名的大小寫(xiě),喜歡車(chē)的品牌等等之間的關(guān)系,這都是我們在傳統分析里面從來(lái)沒(méi)有考慮過(guò)嘗試過(guò)的視角。

  剛才說(shuō)了這么多數據挖掘與分析的事情,什么人來(lái)做這樣的事情,有很多對數據科學(xué)家的定義在這里不想挨個(gè)念一遍,我們認為數據科學(xué)家和傳統的數據分析者是具有一定的差異,他們首先要對非結構化的數據有轉換加工的能力,我拿到了一個(gè)語(yǔ)音,一個(gè)視頻,我想分析它,我不可能直接分析,我要做轉換文本的識別,以及對混雜的不匹配的數據做匹配,以及海量的數據,我通過(guò)什么樣的平臺高效的處理這樣的數據,這是2011年EMC做的市場(chǎng)調查,有三分之二的企業(yè)認為在未來(lái)的五年中,是非常非常需要大數據人才,這是美國的一個(gè)求職網(wǎng)站對于大數據和數據科學(xué)家相關(guān)人員的需求量,這是從2011年開(kāi)始的積分。

  最后一個(gè)問(wèn)題挖掘技術(shù)得加強,是我們文思海輝商業(yè)智能的數據挖掘團隊,我們有來(lái)自于芝加哥大學(xué)、清華大學(xué)、北京大學(xué)等多個(gè)著(zhù)名高校碩士博士組成,我們是一支既懂業(yè)務(wù),又懂數據還懂統計分析的團隊,這個(gè)是我們在銀行業(yè)和證券業(yè)所有的成功案例,謝謝大家。

錯誤報告  分享到:
迁西县| 通城县| 沙雅县| 广东省| 乌拉特前旗| 佳木斯市| 佛山市| 岗巴县| 田东县| 资中县| 长岛县| 铜陵市| 磴口县| 资源县| 大田县| 定日县| 桐梓县| 扶余县| 郧西县| 油尖旺区| 永城市| 屯留县| 天门市| 博兴县| 东安县| 越西县| 荃湾区| 达孜县| 乌什县| 县级市| 五原县| 连南| 贵阳市| 双流县| 永嘉县| 乌鲁木齐县| 普兰店市| 弋阳县| 叙永县| 都安| 长子县|