- 呼叫中心審計揭秘
- 中國移動(dòng)(淮安)呼叫中心:讓世界聆聽(tīng)微笑
- 運營(yíng)管理免費公開(kāi)課:建設自動(dòng)自發(fā)的員工隊伍
- 甘肅省司法廳視頻會(huì )議系統項目公開(kāi)招標公告
- ATCA商用系統全球市場(chǎng)占有率分析
- 未來(lái)的聯(lián)絡(luò )中心:克服商業(yè)與技術(shù)變革帶來(lái)的關(guān)鍵挑戰
- 2013年中國呼叫中心產(chǎn)業(yè)發(fā)展研究調研活動(dòng)
- CTI論壇行業(yè)應用及市場(chǎng)分析主題沙龍 [12月5日]
- CTI論壇行業(yè)應用及市場(chǎng)分析主題沙龍圓滿(mǎn)落幕
- 東進(jìn)技術(shù)發(fā)布keygoe多媒體交換機新版開(kāi)發(fā)包
IBM大數據分享與業(yè)務(wù)洞察(蘇州站)
2014-12-08 14:31:41 評論:0 點(diǎn)擊:
隨著(zhù)中國金融市場(chǎng)的快速發(fā)展,互聯(lián)網(wǎng)金融對傳統金融行業(yè)的競爭,以及監管力度的不斷加強,IT咨詢(xún)服務(wù)公司對金融企業(yè)的商業(yè)智能方案也面臨不斷創(chuàng )新。如何提升金融機構在管理、盈利、風(fēng)險控等多方位的能力?如何將國際經(jīng)驗更好的為中國市場(chǎng)服務(wù)?如何通過(guò)解決方案將海量數據轉化為對經(jīng)營(yíng)決策有價(jià)值的信息之路?如何將客戶(hù)智能分析成果行之有效地運用于服務(wù)渠道,并最終轉換為銷(xiāo)售業(yè)績(jì)?為解決中國金融機構在發(fā)展中所面臨的新問(wèn)題,文思海輝在西安、蘇州、北京、成都、深圳五地舉辦了6場(chǎng)“乘數據之舟,達價(jià)值彼岸”系列活動(dòng)。
在主題為“乘數據之舟,達價(jià)值彼岸”的文思海輝商業(yè)智能解決方案系列研討會(huì )蘇州站現場(chǎng),IBM金融行業(yè)高級架構師徐禮佳分享了IBM大數據分享與業(yè)務(wù)洞察方面的技術(shù)與經(jīng)驗。
IBM金融行業(yè)高級架構師 徐禮佳
以下為演講實(shí)錄:
我是最后一場(chǎng),是因為前面除了賈總講的數據管控,我對他講的數據管否比較佩服,數據管控很難做,他講的非常清楚這些基本功,后面IBM作為文思海輝方面一個(gè)非常密切的合作伙伴,在前面除了講數據管控這一塊領(lǐng)域我們都有非常緊密的合作,數據倉庫、數據集成、數據整合到風(fēng)險數據集市。跟以往我們參加過(guò)這么多活動(dòng)有一個(gè)非常大的不一樣,上研時(shí)期所有求學(xué)時(shí)間都是在蘇州度過(guò)的,所以我對蘇州這個(gè)城市有非常深厚的感情。我們今天市場(chǎng)活動(dòng)有兩個(gè)非常關(guān)鍵的詞,一個(gè)叫數據一個(gè)叫價(jià)值。我們作為數據工作者做了這么多年數據工作,我們一直在等待一個(gè)數據的春天的一個(gè)到來(lái),也就是說(shuō)我們做了這么多年的數據都是希望能夠把數據的價(jià)值盡可能地讓我們的各行各業(yè)能夠呈現出來(lái),所以今天我們市場(chǎng)活動(dòng)主題叫“乘數據之舟、達價(jià)值彼岸”,我覺(jué)得這句話(huà)說(shuō)的非常貼切,這個(gè)時(shí)間點(diǎn)再好不過(guò)了,因為在這個(gè)時(shí)候我們要用數據來(lái)說(shuō)話(huà),要用數據來(lái)看我們核心競爭能力的年代了。
我們城商行和很多大行有很多不一樣,第一個(gè)蘇州銀行尹總講,蘇州銀行IT部門(mén)從去年60個(gè)漲到今年120個(gè)人,年復一年增長(cháng)百分之一百,這個(gè)是令人非常鎮靜的。對于我們很多城商行來(lái)講每天面對的還是運營(yíng)的問(wèn)題。運營(yíng)的問(wèn)題對于每一個(gè)管理層來(lái)講問(wèn)題就是我把有限的錢(qián)有限的時(shí)間和精力和我的人應該放到什么地方去,這個(gè)背后其實(shí)有大量的數據來(lái)支撐,來(lái)幫我們的決策層來(lái)做判斷,現在一個(gè)大數據的時(shí)代,大數據對于很多城商行來(lái)講,他問(wèn)我們第一個(gè)問(wèn)題是說(shuō),大數據對于我來(lái)講是不是一件錦上添花的事情,對于很多銀行來(lái)講,我們每天把大力人力放在我們開(kāi)發(fā)應用上,我先解決我有沒(méi)有的問(wèn)題,數據對于我來(lái)說(shuō)是不是一個(gè)可有可無(wú)呢?剛才我們做風(fēng)險的宋總已經(jīng)給了一個(gè)很好的例子,我們在做所有應用規劃的同時(shí)必須雙管齊下抓數據工作,尤其對于大數據來(lái)講一定是這樣子。因為現在這個(gè)年代如果我們再開(kāi)始做一些應用的話(huà),我們不希望我們剛剛做完上線(xiàn)我們這個(gè)系統就被淘汰了,現在很多的我們發(fā)現尤其是城商行有一些重復的投資、浪費投資,其實(shí)都是由于這樣的原因導致的。
剛才文思數據挖掘小組王為陽(yáng)小伙子也介紹了數據挖掘,數據挖掘在你業(yè)務(wù)方方面面是一個(gè)必備的工具和武器,很多時(shí)候我們業(yè)務(wù)人員簽一個(gè)單,對公業(yè)務(wù)部門(mén)簽一筆信貸合同的時(shí)候,他非常想知道我簽合同之前究竟給銀行帶來(lái)多大的利潤,它對我資本是怎么樣占用情況,所有都需要有數據挖掘和分析的工具才能幫助我們判斷。所以對于數據挖掘不是錦上添花的能力,它其實(shí)現在是我們很多業(yè)務(wù)部門(mén)所必須要具備的一個(gè)基本的能力。
這個(gè)數據挖掘它從整個(gè)的方法論的角度上來(lái)講,它跟我們傳統數據挖掘有什么樣的一些區別呢?在大數據時(shí)代之下,到底我們說(shuō)的數據挖掘和我們傳統有什么樣一些分別?這個(gè)時(shí)候如果我們從方法論角度來(lái)講,它第一個(gè)最主要的一個(gè)分別,也就是很多的書(shū),包括大數據時(shí)代講到一個(gè)最關(guān)鍵的分別,他說(shuō)樣本等于總體,這一點(diǎn)如果我們平時(shí)大家做統計分析的話(huà),可能會(huì )體會(huì )比較深刻。我們平時(shí)在做比如說(shuō)客戶(hù)細分的時(shí)候,我們往往做的第一步是做一個(gè)抽樣,因為我們根據我們個(gè)人的經(jīng)驗對我們的數據、客戶(hù)群體做一定的抽樣,在這個(gè)抽樣基礎上我們再做各種各樣模型的開(kāi)發(fā)。
現在對于大數據來(lái)講,它不再受機損能力的限制,所以它現在很多時(shí)候我們所謂的樣本等于總體。這個(gè)是一個(gè)顛覆性革命性不一樣,這個(gè)不一樣對于我們所有工作者我們思考方式會(huì )帶來(lái)一個(gè)本質(zhì)上的變化。
第二個(gè)是剛才前面的各位老總各位同事都已經(jīng)講到過(guò),大數據它其實(shí)是涵蓋了各種各樣的數據,剛才我們也聽(tīng)的蘇州銀行尹總講他們已經(jīng)開(kāi)始做這方面的嘗試,我們也用一些網(wǎng)絡(luò )的爬蟲(chóng)爬一些數據回來(lái)做一些數據方面的嘗試,所以從我們簡(jiǎn)單的數據結構上來(lái)講,大數據可以分析的數據范圍非常的廣,數據范圍大家往往開(kāi)始做的可能是這些半結構化的日志,網(wǎng)上的微博、微信的言論,我們每個(gè)人地理位置的信息,或者是我們跟第三方有一些數據層面上的交換,所有這些數據其實(shí)現在都可以納入到大數據挖掘的這個(gè)范疇。大數據其實(shí)跟數據倉儲還有一個(gè)很大的不一樣,就是數據倉庫里面其實(shí)存的數據是精子。所謂的精子,每一個(gè)自己都是我們銀行花了大價(jià)錢(qián)買(mǎi)的設備、做的實(shí)施、做的整合,最后總結下來(lái)的數據,這些數據質(zhì)量非常高,每一個(gè)字節的數據都有它一個(gè)很大的價(jià)值所在。對于大數據來(lái)講,很多時(shí)候我們沒(méi)開(kāi)始做挖掘之前,我們不知道在這些低密度低價(jià)值數據當中我們可以得到一些什么,所以這個(gè)是一個(gè)很難的一個(gè)地方。為什么很多城商行會(huì )問(wèn)我們,你們有沒(méi)有總結一些大家通用的應用場(chǎng)景,別人都做了哪些大數據上的嘗試,我可不可以做一模一樣的事情,這個(gè)回答其實(shí)很難,因為它跟應用不一樣,它跟建設CRM也不一樣,像做一個(gè)CRM,它有一個(gè)比較成熟的流程,一個(gè)不能成熟的管理方法,比較成熟的一些界面,我們拿過(guò)來(lái)就可以了。但是大數據它所有的魅力所在就是我們一定要看到你的數據,要運用你數據驅動(dòng)的方式找到數據中有什么樣的價(jià)值。比如說(shuō)當年建設銀行考慮大數據的時(shí)候,北京分行和大數據時(shí)代的作者有一個(gè)面對面的交流,當時(shí)北京銀行就問(wèn)大數據時(shí)代的作者施恩伯格。說(shuō),施恩伯格先生我有很多的數據,我的數據到底有什么樣的價(jià)值?施恩伯格說(shuō),作為建設銀行北京分行,你是不是有北京地區所有二手房成交信貸合同的真實(shí)數據?建行說(shuō),對,我有這個(gè)數據。你有這個(gè)數據的話(huà),你這個(gè)數據反映出房市的情況比任何一個(gè)中介或者掛牌價(jià)都要真實(shí)的數據,因為你是成交價(jià),別人只是一個(gè)掛牌價(jià),如果你用這部分的數據,像我們今天看淘寶經(jīng)濟指數一樣,它可能會(huì )對其他的行業(yè)有很大的價(jià)值,這就是很多大數據之所以能創(chuàng )新一些新的商業(yè)模式的起點(diǎn)。比如說(shuō)每一個(gè)城商行來(lái)講,很多的城商行都有本地大量社保的數據,這點(diǎn)我們有很多挖掘的地方,只是平時(shí)這些數據往往都在沉睡,大家沒(méi)有想到這些數據可以用來(lái)做什么。對于大數據來(lái)講不單單分析了所有類(lèi)型的數據,把很多我們過(guò)去沒(méi)有想到如何去分析的一些數據把它盡可能把它喚醒。
大數據跟傳統BI有很大的區別,傳統的BI很多時(shí)候還是停留在統計和報表層,我們更多是想看看我們過(guò)去歷史上到底發(fā)生了什么,我們再慢慢過(guò)度到預測,預測這個(gè)客戶(hù)什么時(shí)候會(huì )流失,預測這個(gè)客戶(hù)有可能會(huì )買(mǎi)哪一樣理財。但是大部分的時(shí)候我們的業(yè)務(wù)部門(mén)還是要求到我們IT的部門(mén),說(shuō)IT部門(mén)能不能幫我取一下數,幫我建一個(gè)模型,能不能幫我拉一張名單,明天客戶(hù)定存到期了,這張客戶(hù)名單怎么樣,這還是一個(gè)非常漫長(cháng)的過(guò)程。在業(yè)界來(lái)講,大部分時(shí)候這個(gè)周期平均是四到六個(gè)禮拜。四到六個(gè)禮拜之后很多,因為當中會(huì )有很多輪的溝通,業(yè)務(wù)部門(mén)會(huì )告訴IT你的數不對,這不是我要的,我業(yè)務(wù)上不是這樣理解的,有這樣一個(gè)過(guò)程。對于大數據來(lái)講有一個(gè)本質(zhì)上的目的,他是希望能夠把數據盡可能和工具一塊推送給我們的前臺的業(yè)務(wù)人員,能夠讓業(yè)務(wù)人員用一種簡(jiǎn)單、方便、易操作的方式來(lái)做所有這些數據工作。我們在工作當中其實(shí)常常碰到這樣的一些業(yè)務(wù)人員,比如說(shuō)零售銀行部的營(yíng)銷(xiāo)人員,他們一聽(tīng)說(shuō)要做模型他覺(jué)得這個(gè)東西非常的高深莫測,他們覺(jué)得自己都沒(méi)有能力去學(xué)。但是很多時(shí)候他們的一些要求因為相對來(lái)講從統計學(xué)角度來(lái)講是非常容易的一些取數需求,我們對公客戶(hù)對現金流分析有一別基本的要求,計算每一個(gè)對公流量的客戶(hù)隨著(zhù)時(shí)間的變化你對現金需求的曲線(xiàn),這條曲線(xiàn)如果你現在在任何一家銀行要對你所有的對公客戶(hù),每一個(gè)客戶(hù)畫(huà)一條這樣的線(xiàn),我們的IT部門(mén)往往覺(jué)得困難,因為他的計算性能不夠,這是在取數層面非常容易做的,很簡(jiǎn)單并不復雜。大數據根本的目的讓每一個(gè)人都能用數據武裝起來(lái),也就是說(shuō)我們每一個(gè)人在日常工作過(guò)程中學(xué)會(huì )怎么樣用數據指導我的思維方式,而不是靠我們平時(shí)的經(jīng)驗積累。有的時(shí)候我們的經(jīng)驗跟我們的數據是反的,說(shuō)的是不一樣的。所以這個(gè)是大數據的一個(gè)根本目的。對大數據來(lái)講我們業(yè)界有很多不同的理解,剛才副總監也講了,大數據分廣義的大數據和狹義的大數據,對于大數據來(lái)講本質(zhì)上的意思,所有的數據如果沒(méi)有分析那么你的這些數據都只是垃圾數據。為什么在我們IBM體系里邊我們把大數據跟分析放在一起講的,是一個(gè)單詞。也就是說(shuō)數據跟分析是密不可分的,不是光有數據就可以了,我做了所有的數據工作,但是我的數據沒(méi)用起來(lái),也不是光有分析就可以了,我們常常見(jiàn)到很多的博士經(jīng)常來(lái)講分析各種模型的一個(gè)重要性,但是他往往忽略了一個(gè)數據的基礎,如果你數據基礎沒(méi)有打的很牢靠的話(huà),你分析你模型做出來(lái)的結果是錯誤的。所以這兩者一定是相輔相成,哪一個(gè)環(huán)節都不可以或缺的。從技術(shù)角度上來(lái)講,大數據分兩大分支,前面各位總監也都有涉及,一個(gè)技術(shù)的分支就是我們現在非常熱的Hadoop分支,另外一個(gè)是流計算的分支,流計算的分支開(kāi)元技術(shù)誕生之前,IBM實(shí)驗室911以后按照美國政府的要求就開(kāi)始做流計算的一個(gè)研發(fā),流計算根本目的解決數據分析時(shí)效性,如果我們現在所有做的數據分析是一定要把數據存到一個(gè)庫,存到一個(gè)平臺上,再開(kāi)始做加工,但是對于流計算說(shuō)不需要,它分析的時(shí)效性按照秒、毫秒級來(lái)的,所以這兩個(gè)是很大的技術(shù)分支。但是他們有很大的一個(gè)共通性,因為他們都是建立在大規模集群這樣的一個(gè)線(xiàn)性擴展平臺基礎之上,而且這兩者都可以分析各種形態(tài)的各種類(lèi)型的數據。所以這個(gè)是大數據的兩種基本的一個(gè)分支。
在這里面再簡(jiǎn)單回顧一下,大家通常會(huì )問(wèn)的,如果我們的IT部門(mén)分成數據小組跟數據分析小組的話(huà),我們數據分析小組如果是傳統上做建模博士、碩士們,他們一定分的是,我現在在大數據上數據挖掘和傳統倉儲之上做的數據挖掘到底有哪些區別,這些區別我們在出各種各樣的白皮書(shū),總結下來(lái)大概有四點(diǎn)。第一點(diǎn)我們剛才講的全樣數據和采樣數據的一個(gè)分別。采樣這個(gè)過(guò)程在過(guò)去傳播上我們有很多的統計學(xué)的博士、數學(xué)博士在各種的學(xué)術(shù)領(lǐng)域探討如何采樣,來(lái)提高采樣的精確性。采樣根本的問(wèn)題同樣是說(shuō)你得知道數據的分布你才知道如何采樣,而在另外一些業(yè)務(wù)場(chǎng)景之下,我們往往找到數據上不是滿(mǎn)足它分布的那些異常的數據,這個(gè)時(shí)候你就沒(méi)辦法進(jìn)行采樣,因為采樣會(huì )把這些異常數據給首先剔除掉,全樣計算一定比采樣計算來(lái)得好。但是好多少,準確率提升多少,對我們模型效率有什么樣的變化,目前還沒(méi)有一些數據來(lái)支撐。我們根據我們做的不同業(yè)務(wù)場(chǎng)景我們可以嘗試比較一下,不是說(shuō)在任何一個(gè)場(chǎng)景之下都不應該做采樣,不是這樣子。比如說(shuō)做信用風(fēng)險評分,所有信用風(fēng)險評分維度和方法都是相對比較成熟的,我猜測這個(gè)時(shí)候全樣跟采樣沒(méi)有太大的分別。可能在其他的一些業(yè)務(wù)場(chǎng)景下,采樣跟樣本會(huì )有很大的分別,這個(gè)我們需要用數據驗證。
第二個(gè)差別是說(shuō)數據整合的這個(gè)工作量會(huì )大大縮小,這個(gè)怎么理解呢,如果我們在座大家都建過(guò)數據倉庫的話(huà)我們知道,我們從原系統把數據抽取、轉換到數據倉庫的話(huà),我們有一個(gè)完整的數據管控體系,我們有相應數據標準,我們要做ELT的一個(gè)設計數據模型設計,把數抽調數據倉庫來(lái)。所以對于數據倉庫來(lái)講它整個(gè)建設周期把數提到倉庫來(lái),這已經(jīng)是好幾個(gè)月的事情,我們的數據才能被其他的業(yè)務(wù)部門(mén)生成報表等等等等。但是大數據它的做法不一樣,因為它上面是沒(méi)有模型的,它的數據可以直接按各種文件的方式加載過(guò)來(lái),我們在上面用各種各樣的分析工具先來(lái)?yè)б槐檫@個(gè)數據,你可以對它做查詢(xún),也可以對它各種各樣,比如說(shuō)SAAS來(lái)建模,建完模以后如果我們模型質(zhì)量有問(wèn)題,我們可以再做數據清洗的工作來(lái)決定,這樣整個(gè)數據整合的工作量是大大減少。我們一般來(lái)講,在我們做的這個(gè)項目當中,一般來(lái)講你把大數據平臺裝上來(lái),數據倒過(guò)來(lái),基本上一兩個(gè)禮拜以后有一個(gè)初步的分析結果提出來(lái)。如果大家用大數據平臺作為一個(gè)分析這樣的一個(gè)類(lèi)似庫這樣的一個(gè)不是庫的一個(gè)平臺的話(huà),它的效率比我們傳統做法會(huì )有一個(gè)很大的提高。
第三個(gè)叫數據驅動(dòng)洞察。這個(gè)過(guò)程我們大家也已經(jīng)有了很充分的一個(gè)討論,我個(gè)人對這句話(huà)的體會(huì )是說(shuō),我們過(guò)去業(yè)務(wù)部門(mén)提一個(gè)命題的時(shí)候,他往往先帶有自己的一個(gè)假設,根據這個(gè)假設要求我們IT部門(mén)提一些數,來(lái)建一下模型,我來(lái)驗證一下我這種說(shuō)法對不對。比如說(shuō)今年上半年在某一家銀行,他們的零售銀行部給我提了一個(gè)命題,說(shuō)我現在有十個(gè)客戶(hù)分群,代法工資群、社保群,那些那些客戶(hù)群一共十個(gè)客戶(hù)群,你能不能把十個(gè)客戶(hù)群的營(yíng)銷(xiāo)策略幫我設計一下。我反過(guò)來(lái)問(wèn)他第一個(gè)問(wèn)題是,你為什么把你的客戶(hù)分為這十個(gè)群,你為什么認為給這十個(gè)客戶(hù)群做營(yíng)銷(xiāo)策略能給銀行下半年帶來(lái)更多的盈利。他們零售銀行部的老總也是一個(gè)博士,一拍腦袋說(shuō),他說(shuō)這有可能是一個(gè)偽命題,我說(shuō)對,這有可能是一個(gè)偽命題,因為我們沒(méi)有用數據去看在這個(gè)銀行什么樣的客戶(hù)是盈利或者有可能會(huì )盈利的,我們只是根據個(gè)人的經(jīng)驗把我們客戶(hù)分成不同的特征,而我們抓住僅僅是客戶(hù)某一個(gè)特征,而實(shí)際上我們在對客戶(hù)分群的話(huà),多個(gè)特征的一個(gè)組合而不僅僅是單個(gè)特征,所以數據驅動(dòng)洞察的做法是,讓我們先拋棄我們對這個(gè)事務(wù)本身的一些假定的一個(gè)認識。我們先來(lái)看看數據是不是告訴我同樣的事情或者是另外一些想法,我再來(lái)看我怎么樣采取相應的行動(dòng)。所以它跟我們傳統上業(yè)務(wù)部門(mén)提一個(gè)問(wèn)題提一些假設再來(lái)驗證,整個(gè)過(guò)程是不一樣的。
最后一條是說(shuō)數據采集一開(kāi)始,同時(shí)就開(kāi)始溶解。這個(gè)是跟我們數據一個(gè)時(shí)效性密切相關(guān)的。前面各位老總也講,我們很多數據倉庫最少也是T+1,很多是T+1.5、T+2。所以你數據進(jìn)來(lái)的時(shí)候你沒(méi)辦法對他做任何的分析和判斷,直到第二天日結之后才能看到。對于很多業(yè)務(wù)場(chǎng)景之下其實(shí)我需要知道的是越快越好。比如說(shuō)你做信用卡返期帳戶(hù),我當然希望這個(gè)交易進(jìn)行過(guò)程當中,100毫秒之內我就想知道這筆交易是否有欺詐的可能性。當然我們現在傳統做法,我會(huì )把欺詐的規則寫(xiě)成一個(gè)規則庫,管它一百條兩百條一千條規則,我盡可能抽樣,抽一些規則抽一些交易來(lái)跑,但是這不是一個(gè)全面的做法。大數據時(shí)代既然技術(shù)上沒(méi)有這樣的一些局限,我們可不可以把這個(gè)時(shí)效性進(jìn)一步提高。
還有在一些場(chǎng)景之下的,我們業(yè)務(wù)部門(mén)其實(shí)非常想要知道的是一些準時(shí)時(shí)一些趨勢性的數據統計。比如說(shuō)營(yíng)銷(xiāo)部門(mén)做了一個(gè)市場(chǎng)活動(dòng),他其實(shí)很想知道做完這個(gè)市場(chǎng)活動(dòng)一個(gè)小時(shí)之內到底有多少客戶(hù)響應了這個(gè)活動(dòng),我這個(gè)策略是否需要改,需要準時(shí)時(shí)的數據,而不是第二天看到一個(gè)匯總的信息。
現在有很多家銀行已經(jīng)有這樣的一些行長(cháng)儀表盤(pán),行長(cháng)的儀表盤(pán)就是行長(cháng)關(guān)注的那十個(gè)指標,它是時(shí)時(shí)去刷,基本上準時(shí)時(shí)去刷,這樣時(shí)效性對于我們決策有很大的幫助,我們知道很多事情當你塵埃落地之后再想做任何的改變都為時(shí)過(guò)晚了,所以我們能提高這個(gè)分析數據時(shí)效性的話(huà)這是非常值得去嘗試的一個(gè)領(lǐng)域。
剛才宋總講多風(fēng)險數據提示,在大數據時(shí)代我剛才講前面一個(gè)片子有一些數據中心的同事問(wèn)我,既然是大數據時(shí)代之下數據不需要整合,是不是全行所有數據上都不需要整合,直接扔到大數據平臺上都可以去做呢?其實(shí)不是這樣子的。這個(gè)像剛才宋總講的,風(fēng)險數據集市這個(gè)領(lǐng)域,我們有認為數據整合有很大的必要性,而且是必須要做整合的。為什么呢?就像宋總講的,其實(shí)對風(fēng)險數據提示來(lái)講,如果沒(méi)有這個(gè)東西它是傳統的三種做法,要么各自建應用,應有下面再帶各自的數據庫,要么從數據倉庫上衍生出來(lái)這樣風(fēng)險應用,要么單獨建一個(gè)數據集市,對于這三種做法來(lái)講,如果數據不整合的話(huà),你要出一些風(fēng)險的報表尤其是要滿(mǎn)足新發(fā)協(xié)議這樣的報表你的困難會(huì )非常的大,你會(huì )花大量的人力、時(shí)間、精力做手工并表的工作,所以我們強烈推薦第三種做法,你一定要有一個(gè)風(fēng)險數據集市把你的數據整合起來(lái)。這個(gè)整合方式跟剛才大數據的方式是完全不一樣的整合方式,這個(gè)整合方式之下你的風(fēng)險數據集市會(huì )有一個(gè)非常完整的非常固定的一個(gè)數據模型,你在這之上會(huì )出滿(mǎn)足所有巴塞爾2、巴塞爾3監管的報表,這個(gè)時(shí)候你還會(huì )有相應的一些管理的報表也可以從這個(gè)風(fēng)險集市上出,所以這個(gè)數據整合有它的必要性,在特定的業(yè)務(wù)場(chǎng)景下有它一個(gè)很大的必要性。
這個(gè)我就不詳細講這三種具體的一個(gè)做法。這個(gè)時(shí)候巴塞爾作為我們合作伙伴,他們實(shí)施了很多風(fēng)險數據提示項目。從IBM設計的角度上來(lái)講,我們也認為從風(fēng)險的角度應該分成五個(gè)層次的整合,從數據的整合到應用的整合到你最后整個(gè)報表體系的整合,所以這個(gè)是另外一塊完全獨立的領(lǐng)域,跟大數據不一樣的是,如果我們有相對固定的數據的一個(gè)需求,而且我們經(jīng)常會(huì )有這樣的一些監管需求,我們建議大家還是用傳統的數據庫、數據倉庫一體機的技術(shù)來(lái)解決,大數據技術(shù)我們建議大家用新的一些更偏近于探索或者是數據挖掘的要求,我們可以進(jìn)一步放在大數據上來(lái)做。大數據大數據,其實(shí)我們IT部門(mén)肯定做技術(shù)的人員會(huì )為這樣一些新的技術(shù)心潮澎湃,但是對于我們業(yè)務(wù)部門(mén)來(lái)講我們根本不管下面到底是數據庫還是Hadoop他需要的是一個(gè)結果,很多時(shí)候我們大數據落地過(guò)程中非常非常困難,對于IT部門(mén)來(lái)講我們到底做什么樣的應用給到我們業(yè)務(wù)用戶(hù)。這個(gè)應用的話(huà)從我個(gè)人經(jīng)驗上來(lái)講,我覺(jué)得我們還是要做一些雪中送炭的項目而不是錦上添花的項目。什么叫雪中送炭的項目呢?其實(shí)我們跟業(yè)務(wù)部門(mén)接觸的過(guò)程當中,發(fā)現很多很多業(yè)務(wù)部門(mén)其實(shí)他基本上在做業(yè)務(wù)的過(guò)程中很少用數據,大部分的時(shí)候都是憑自己個(gè)人的經(jīng)驗去做的。比如說(shuō)我們銀行里普遍實(shí)行的客戶(hù)經(jīng)理制,客戶(hù)經(jīng)理制一個(gè)客戶(hù)經(jīng)理往往要關(guān)到一百個(gè)到幾百個(gè)客戶(hù),基本上我很少碰到客戶(hù)經(jīng)理他能夠對一個(gè)客戶(hù)所有的歷史都講的很清楚,這個(gè)客戶(hù)在我這里買(mǎi)過(guò)什么產(chǎn)品,他發(fā)生過(guò)什么事情,最近有什么樣的投訴,除非他抓的很緊的一些大客戶(hù)他知道,大部分的客戶(hù)他知道的都不完整。當這個(gè)客戶(hù)經(jīng)理流失的時(shí)候,新的客戶(hù)經(jīng)理面對老的客戶(hù)的時(shí)候,他往往會(huì )造成一個(gè)流失的風(fēng)險。
因為老客戶(hù)會(huì )認為新的客戶(hù)經(jīng)理對我一無(wú)所知,這些數據其實(shí)都在我們系統當中,但是我們很少把它按照客戶(hù)經(jīng)理要求抓出來(lái)。我們大部分的銀行都有CRM系統,我們IBM也有我們的CRM系統,但是我們CRM系統每天干的最多一件事情就是客戶(hù)經(jīng)理往里面去錄入,但是要問(wèn)他什么時(shí)候用過(guò)CRM里面的數據幫你分析客戶(hù)本身的需求,我相信大部分的CRM都沒(méi)有這個(gè)功能,也就是說(shuō)真正意義上的ACRM其實(shí)很少,而且做的都不好。這個(gè)其實(shí)在大數據時(shí)代是大家探索去做的最多的一個(gè)領(lǐng)域。我們在全球的調研之下,差不多55%到65%的客戶(hù)做的第一個(gè)項目都是跟客戶(hù)有關(guān)的,客戶(hù)里邊大數據里邊做的第一件事情最簡(jiǎn)單的事情就是客戶(hù)360度試圖,這個(gè)試圖在大數據平臺不像過(guò)去我要做復雜的數據管理工作,把客戶(hù)主數據管理起來(lái)我在這上面再做。大數據平臺下它有它所有的工具,可以把你的客戶(hù)按照各種特征把它匹配起來(lái),不是說(shuō)只有統一客戶(hù)號才叫單一客戶(hù)試圖,你的客戶(hù)如果說(shuō)跟另外一個(gè)帳戶(hù)滿(mǎn)足任何的,你可以定哪一些條件的匹配他們都可以屬于同一個(gè)客戶(hù),這個(gè)給到我們業(yè)務(wù)用戶(hù)一個(gè)非常或的一個(gè)體驗,就是你可以迅速知道你一個(gè)客戶(hù)全面的情況,這個(gè)我相信對客戶(hù)經(jīng)理非常有用,這個(gè)其實(shí)對我個(gè)人的工作也非常有用,我曾經(jīng)在我們的CRM系統里嘗試做這樣的一個(gè)工作,我搜索了一下中國銀行,我想知道中國銀行買(mǎi)過(guò)所有IBM產(chǎn)品、服務(wù),以及最近我們雙方所有交互的記錄,但是我找不到,光中國銀行這個(gè)客戶(hù)我們在系統里差不多有二三十個(gè)客戶(hù),每個(gè)都是因為拼寫(xiě)上有一點(diǎn)點(diǎn)差別,它就變成一個(gè)新的客戶(hù),這個(gè)對于客戶(hù)體驗來(lái)講非常的差,但是在大數據平臺上來(lái)講,從技術(shù)角度來(lái)講是非常容易去做這件事情。第二個(gè)對我們IT部門(mén)來(lái)講,我們自身的運營(yíng)有很多可以去優(yōu)化的地方。這個(gè)運營(yíng)怎么理解呢,第一個(gè)我們運維部,最累的我認為就是運維部同事,我一聽(tīng)說(shuō)誰(shuí)當運維部老總,我都會(huì )跟他說(shuō)祝你好運。忙的連喝水的時(shí)間都沒(méi)有。為什么呢?
因為這個(gè)系統總是會(huì )出問(wèn)題,出問(wèn)題以后運維部會(huì )承擔很大的責任,運維部門(mén)他們告訴我,他們現在所有監控的一些工具都能實(shí)現一些比較復雜的端到端的監控功能,它的監控都是按照設備來(lái)的,監控服務(wù)器,監控網(wǎng)絡(luò )等等一個(gè)一個(gè)來(lái)的,它說(shuō)它很少能有一個(gè)應用能把這些都串在一起。我作為客戶(hù)在網(wǎng)上登陸網(wǎng)銀,我不能實(shí)現轉賬了,我接下來(lái)首先打給客服,為什么我們不能轉賬,我不知道它是什么意思,這個(gè)時(shí)候客服要把這個(gè)記錄下來(lái)回饋給我們的IT部,IT部再回過(guò)去查各種各樣的日志,這個(gè)時(shí)間周期非常長(cháng)。我們最近和一家銀行做的,我們用流計算技術(shù)把大批量各種系統的日志直接進(jìn)到流計算平臺,時(shí)時(shí)做日志與日志之間的關(guān)聯(lián)判斷當一個(gè)交易發(fā)鼓掌的時(shí)候究竟哪一個(gè)設備哪一個(gè)應用當時(shí)出了問(wèn)題,這個(gè)時(shí)間上現在可以做到五分鐘以?xún)壬踔潦歉伲晕覀(gè)人認為這個(gè)是一個(gè)非常非常大的對客戶(hù)的一個(gè)體驗上的一個(gè)提升。我常常會(huì )打電話(huà)給IT庫存,說(shuō)我今天又不能做一個(gè)什么操作,IT庫存每一次給我們回答是,我知道你有這個(gè)問(wèn)題,三天以后告訴你結果,三天以后我早就把我錢(qián)轉到另外一家銀行去了,我現在的客戶(hù)我有這么多選擇的情況下,我根本不會(huì )等你三天時(shí)間告訴我你為什么發(fā)生故障。這樣的情況下對于我們運維部門(mén)可以充分考慮大數據平臺可以給我們提高哪些效率上的提升。另外一條很大的一點(diǎn)管理這個(gè)風(fēng)險。管理這個(gè)風(fēng)險的話(huà),剛才我們前面講了很多關(guān)于風(fēng)險數據集市,風(fēng)險數據集市管理是我們已知風(fēng)險類(lèi)別,信用風(fēng)險、操作風(fēng)險、市場(chǎng)風(fēng)險。互聯(lián)網(wǎng)金融給我們帶來(lái)很大的沖擊,現在有很多P2P、P2B存在,但是這些風(fēng)險在哪里呢,我們怎么樣管控小微的風(fēng)險。管控小微的風(fēng)險,里面很難做的一條,第一我沒(méi)辦法讓我客戶(hù)經(jīng)理對所有小微企業(yè)做一個(gè)盡責的調查,因為這個(gè)量太大,我客戶(hù)經(jīng)理相對兩講根本管不過(guò)來(lái)。第二種大家問(wèn)的是說(shuō)你有沒(méi)有一個(gè)辦法,用大數據的辦法幫我找到很多行外的數據能夠幫助我來(lái)綜合判斷一家小微企業(yè)的一個(gè)風(fēng)險。這個(gè)現在業(yè)界大家在大數據領(lǐng)域做的探索非常的多,我們也在做一些相應的項目,怎么樣去用更多的數據,用一個(gè)新的維度判斷小微企業(yè)的風(fēng)險或者我們看不到的風(fēng)險,這一塊做出來(lái)的話(huà),相信對于未來(lái)幾年市的格局有一個(gè)革命性的影響。
最后一個(gè)是一個(gè)新的商業(yè)模式。這個(gè)新的商業(yè)模式我發(fā)現其實(shí)互聯(lián)網(wǎng)企業(yè)走得很前,因為它本來(lái)上來(lái)就沒(méi)有客戶(hù),它有的就是數據,所以從數據里實(shí)現了非常多的一個(gè)變現的能力,也就是說(shuō)把它的數據變成各種各樣的分析和指標,給到需要他用的。我們發(fā)現在國外很多的企業(yè)尤其是銀行,說(shuō)到底互聯(lián)網(wǎng)企業(yè)掌握的數據跟我們銀行還是不能比,我們銀行還是掌握了大量真實(shí)客戶(hù)和客戶(hù)交易的數據,只不過(guò)我們用途上用的方面比互聯(lián)網(wǎng)企業(yè)要慢一些。這方面國外有很多的企業(yè),包括保險公司,都把它的客戶(hù)和客戶(hù)數據匯總之后,能夠給到第三方,讓第三方做他的一些用途。比如說(shuō)保險公司把它的一些數據給到了醫院和醫療行業(yè),讓他能夠幫助醫療行業(yè)來(lái)判斷一個(gè)客戶(hù)什么時(shí)候有得病的風(fēng)險。去年年底泰康跟咕咚網(wǎng)聯(lián)合做了一個(gè)“活力計劃”,泰康用戶(hù)同意把咕咚手環(huán)的數據給到保險公司,保險公司會(huì )幫你來(lái)降低你的人壽保險的費用,這個(gè)是一個(gè)很好的業(yè)務(wù)創(chuàng )新。但是你想一想,一個(gè)手環(huán)現在可裝戴設備它所掌握不遠遠是每一個(gè)人的心跳和走多少步,他掌握了很多信息,他知道我去過(guò)哪里,這些數據匯總到一起可以給各行各業(yè)提供非常多的商機。
另外一條變現的能力我們發(fā)現現在是很多企業(yè)真正的一個(gè)核心競爭力,真正把數據變現的企業(yè)不著(zhù)急講在市場(chǎng)上做什么事情,因為他在悶聲大發(fā)財呢。有人問(wèn)過(guò)我,微軟大數據幫助奧斯卡金像獎準確預測了24個(gè)獎里21項,這是很強的變現能力。IBM數據大平臺有什么變現能力跟微軟比。我當時(shí)的回答,這跟用劍一樣,劍耍在誰(shuí)的手里變現能力就掌握在誰(shuí)的手里,而不是工具本身。你現在手里握一把寶劍,怎么樣對它變現直接體現你對數據的一個(gè)使用能力。
這些是我們現在在做一些相對微觀(guān)的應用場(chǎng)景,這些應用場(chǎng)景我只是想給到大家一個(gè)拋磚引玉的作用,告訴大家我們用大數據做過(guò)什么可以做什么。這里面第一大類(lèi)我們叫輿情類(lèi)分析,輿情類(lèi)分析會(huì )在網(wǎng)絡(luò )上做一些爬蟲(chóng),輿情類(lèi)分析相對來(lái)講比較成熟的一個(gè)模塊,很多銀行用它做產(chǎn)品品牌的分析,我行發(fā)了一張信用卡,這張信用卡跟蘇州地區同樣廣發(fā)發(fā)的卡有什么特色,客戶(hù)為什么喜歡廣發(fā)的卡,可以做一些輿情比較,對市場(chǎng)部的同事非常有用。市場(chǎng)部現在每天都有很多位同事從各種論壇、網(wǎng)上去找,有的時(shí)候甚至需要找危機公關(guān)。輿情類(lèi)分析大數據平臺是完全自動(dòng)化的過(guò)程,它可以幫助我們更加快速對相應一些事件做出反應,這個(gè)是第一大類(lèi)。
第二大類(lèi)我們叫營(yíng)銷(xiāo)類(lèi)分析,這個(gè)營(yíng)銷(xiāo)類(lèi)分析剛才王為陽(yáng)小伙子講的所有數據挖掘的模型,只不過(guò)它在大數據平臺上可以做的,第一個(gè)模型可以跑得更快,第二數據涵蓋的范圍更廣,地對大量的歷史做客戶(hù)行為的分析,所以營(yíng)銷(xiāo)類(lèi)的分析背后就是對客戶(hù)的細分客戶(hù)行為的分析等等做大量的分析,最后給營(yíng)銷(xiāo)部門(mén)做一些營(yíng)銷(xiāo)策略輔助的一個(gè)幫助。
第三部分是我們剛才講的業(yè)務(wù)轉型。業(yè)務(wù)轉型你怎么樣把你的數據變現的一個(gè)能力,這個(gè)時(shí)候其實(shí)我們每一家銀行我們仔細想一想你的數據跟你合并的這家銀行一定有很大的不同,因為你吸引的一個(gè)客戶(hù)跟他會(huì )有不同,所以你的數據你的客戶(hù)里一定能挖掘出來(lái)跟他不一樣的地方,這部分是我們仔細去想一想我到底能做什么樣的一些業(yè)務(wù)某性,這一點(diǎn)尤其對于我們城商行非常重要的,對大行來(lái)講,也許他的業(yè)務(wù)范圍是大而廣的,但是對于城商行我們要有我們業(yè)務(wù)特色,我們要占領(lǐng)市場(chǎng)上很特別很專(zhuān)的領(lǐng)域,這個(gè)時(shí)候專(zhuān)業(yè)領(lǐng)域落腳點(diǎn)在哪里,這個(gè)需要我們數據去幫忙的。
第四大類(lèi)是一個(gè)從業(yè)務(wù)的角度上來(lái)講非常簡(jiǎn)單,但是對于我們業(yè)務(wù)部門(mén)來(lái)講又非常需要的一類(lèi),叫查詢(xún)類(lèi)的分析。查詢(xún)類(lèi)的分析很多時(shí)候我們講的是,我們現在有大量的歷史數據,如果你把大量的歷史數據兩年以上的數據都放在數據倉庫里查詢(xún),這個(gè)成本非常高。如果你要查一些日志的話(huà)根本上不可能。所以很多時(shí)候你可以考慮把你所有的歷史數據、所有的詳單,這一點(diǎn)在電信行業(yè)做的很多,他們把它放在大數據平臺上,用做大量的查詢(xún),這個(gè)可以減輕IT部門(mén)工作量,你現在的數據是一種服務(wù),通過(guò)服務(wù)方式給到業(yè)務(wù)部門(mén),不是搭總線(xiàn)的服務(wù),而是給他一個(gè)可視化的工具讓他對數據進(jìn)行操作。
最后一條運維的優(yōu)化、調查,這個(gè)剛剛我們講過(guò)了。其實(shí)現在很多運維的工具,包括日志的分析,包括設備的安全管理等等,它下面的基礎都是大數據的平臺,我們運維部門(mén)如果你希望在工作中有時(shí)間喝一杯咖啡,你可以考慮一下如何用大數據平臺做這個(gè)運維。
后面的案例我不仔細講了,都是我們做過(guò)的一些技術(shù)。
最后我想講的是給大家一些建議,我覺(jué)得現在我們來(lái)參加這個(gè)會(huì )的銀行一定對數據非常重視的銀行,我們有了文思海輝這樣一個(gè)非常好的合作伙伴,基本上你也不用太多顧慮你在人才上的一個(gè)短缺,因為對文思海輝有各個(gè)事業(yè)部,每個(gè)事業(yè)部下都有非常專(zhuān)業(yè)的人才,不管是統計博士還是數據倉庫的小組,所以我們考慮是同銀行自身業(yè)務(wù)出發(fā),你有什么樣典型的一些應用場(chǎng)景,業(yè)務(wù)部門(mén)有哪些痛點(diǎn)我們可以用大數據平臺或者是新的技術(shù)和方法來(lái)解決的,不要做一些純粹是技術(shù)上的一些嘗試,因為對于業(yè)務(wù)部門(mén)來(lái)講他根本不關(guān)心我們用什么樣的技術(shù)。
第二個(gè)對于大數據來(lái)講,很多時(shí)候技術(shù)本身還在發(fā)展過(guò)程當中,兩年前我們說(shuō)做海量歷史數據查詢(xún)和分析的時(shí)候,它的響應時(shí)間還是相對來(lái)講是比較的不能跟OLTP系統來(lái)比,放在現在來(lái)講的話(huà),這一點(diǎn)完全能滿(mǎn)足你的要求了。所以這個(gè)大家一定要考慮技術(shù)本身還再一個(gè)發(fā)展過(guò)程當中。
評論排行更多>>
- ·uc營(yíng)銷(xiāo)管家——高效率的銷(xiāo)售軟件(28)
- ·代替人工撥打電話(huà)的軟件:亮劍天下自動(dòng)語(yǔ)音群呼營(yíng)銷(xiāo)(14)
- ·商路通技術(shù)總監黃河專(zhuān)訪(fǎng):技術(shù)上叫板的瘋子(13)
- ·華晨汽車(chē)客服中心通過(guò)CC-CMM應用級L1認證(7)
- ·小米擠下HTC,居中國消費者常用手機第五(6)
- ·因科美E350不需電話(huà)會(huì )議平臺就能實(shí)現多方電話(huà)會(huì )議(6)
- ·技術(shù)上叫板的瘋子(5)
- ·億倫公司推出新版本“智能外呼營(yíng)銷(xiāo)平臺”(5)
- ·小米擠下HTC,居中國消費者常用手機第五(5)
- ·葡萄牙電信攜手華為部署LTE商用服務(wù) (4)
- ·客服人生:入職凡客四年半的她,剛“被離職”(4)
- ·殺毒先鋒2.0新版發(fā)布,功能升級(4)
- ·騰訊EC與金倫合作 開(kāi)啟云聯(lián)絡(luò )中心新里程(4)
- ·態(tài)度是一把鑰匙(3)
- ·未來(lái)的聯(lián)絡(luò )中心:克服商業(yè)與技術(shù)變革帶來(lái)的關(guān)鍵挑戰(3)
- ·電話(huà)、電話(huà)、更多的電話(huà):如何管理?(3)
- ·億群發(fā)布GSM/3G IP通信解決方案(3)
- ·華為與瑞星建立云計算虛擬化防病毒戰略合作關(guān)系(3)
- ·塔迪蘭Aeonix統一通信和協(xié)作(UC&C)解決方案(3)
- ·金倫企呼云呼叫中心備受媒體及用戶(hù)關(guān)注(3)
相關(guān)信息
- 北京區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 華南區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 華北區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 西南區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 華東區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 西北區金融商業(yè)智能解決方案研討會(huì )綜合報道
- 文思海輝:互聯(lián)網(wǎng)金融時(shí)代下,客戶(hù)需求是重中之重
- 文思海輝:大數據提高智慧金融競爭力
- 文思海輝:風(fēng)險控制仍是互聯(lián)網(wǎng)金融之本
- 文思海輝:云計算為金融創(chuàng )新提供深入支持