首页 > 娱乐前沿 > 产经
要靠数据寻找分行营运新机会,玉山资料科学团队经验大公开
梁子 2016-10-01 10:16:23

玉山银行资讯处襄理洪采襄表示,资料分析人员必须让资料分析更快速、有效率。像玉山是以资料仓储作为资料集散中心,来满足后续资料科学分析时的需求。(图片来源/iThome) j3A我酷网

每个人生活都很难脱离银行,举凡从户头中提领到第一份薪水、信用卡消费,以及车贷、房贷等大小事,都必须借助银行的帮助,面临未来金融科技FinTech、理专机器人,甚至软体机器人Bot的竞争,银行也得走向Bank 3.0的转型之路。j3A我酷网

目前正处于数位转型阶段的玉山银行,近年已经开始利用大数据、资料科学,来分析全台湾数百家分行,根据各区域拟定不同的经营策略,连只用54天就让银行核心系统上线的上海华瑞银行CIO孙中东闪电来台时,都指名要和玉山银行见面。j3A我酷网

身为玉山银行资料科学团队一员的玉山银行资讯处襄理洪采襄表示,过去举凡存钱、领钱、缴费等业务,大多必须仰赖实体分行,不过随着行动装置愈加普及,银行所能触及的业务範围越广,例如网路银行、线上柜台,以及网路ATM,甚至是跨业合作、跨境金流、线上购物业者结盟。j3A我酷网

凡走过必留下痕迹,消费者在银行中一举一动所留下的记录,也都成为银行发展业务的重要分析参考。j3A我酷网

拥有如此大笔资料,对于资料科学家理应是喜事,「不过之后我们便开始苦恼了。」洪采襄表示,银行旗下业务不仅繁杂,各自还有对应的业务系统,每套系统都对应到不同的开发人员、维护厂商。面对如此複杂内部系统产生的庞大资料,她表示,资料科学团队不可能临时才决定使用哪些资料来满足特定分析需求,「光是整理、收集完所需资料得花的时间,大概就足以遭到老闆开除了。」j3A我酷网

洪采襄表示,资料分析人员必须让资料分析更快速、更有效率,玉山银行就是用资料仓储作为资料集散中心,来满足后续资料科学分析时的需求。j3A我酷网

玉山银行资料处理4大步骤j3A我酷网

一般来说,银行内部资料仓储彙集来自各业务系统的资料后,需先对资料进行ETL处理(Extract-Transform-Load,萃取、转换及载入)。洪采襄表示,ETL程序包括四个步骤。第一是统一资料格式,例如像常见的日期资料,除了系统开发者或厂商不同,对于日期格式的呈现和记录方式也都不一样,如採用民国年或用西元年。在时序安排中,也有年月日、日月年、月日年等不同排列组合,「为了要让资料分析人员更为便利,玉山银行统一採用西元年,採年月日的方式呈现。」j3A我酷网

第二步骤则是初步资料检核,确保收集到的资料不会重複。像用户身份证字号都是唯一值,就可作为判断资料是否重複的检查条件。洪采襄归纳2种常见资料重複的原因。一是行员手动输入资料错误,而业务系统没有查核。第二是,业务系统开发人员多次将同样的资料存入资料仓储中导致重複。为了避免出错,洪采襄提醒,业务系统开发者要确认汇出,再者是资料逻辑转换,她解释,例如针对特定的业务需求,玉山银行会事先进行资料逻辑转换,将转换后的成果储存在资料仓储,例如将顾客存款、基金、保险等不同类型的资产资讯改以顾客身分别彙整集中后,资料分析人员就可以在资料仓储中查询到特定客户拥有的总资产数目。j3A我酷网

不过,由于个资法的规範,洪采襄表示,虽然资料仓储内有原始资料,但用于分析时,系统提供出来的资料,都会经过用户个资去识别化处理,同时,玉山银行也对严格控管使用分析软体的使用者权限,与将所有操作过程用萤幕录影来稽核。j3A我酷网

最后一个阶段才是依照资料科学团队设计的资料模型,将资料汇入资料仓储中。洪采襄认为,收集这些资料只是最基本的功夫,后续才可以产出报表、仪表板等视觉化应用,或是整理行销名单给相对应单位来进行销售活动。j3A我酷网

资料梳理后才是挑战的开始j3A我酷网

收集如此多笔资料后,要如何利用资料科学,解决银行的营运问题?洪采襄表示,经营银行碰到的问题多如牛毛,像是思考顾客喜欢的通路形式,ATM设点位置、安排客服人员,或是衡量网路银行使用状况,评估未来是否能找到更多潜在顾客。j3A我酷网

玉山银行资料科学团队目前有3大资料应用,第一是了解不同属性顾客,在不同通路的使用状况以及偏好。第二是剖析分行通路,了解它面临数位转型过程中,每一间分行是否存在独特的特质。第三则是思考能否将目标缩小至单一消费者,能为不同顾客提供各自专属的客製化服务。j3A我酷网

分析不同用户的跨通路使用习惯j3A我酷网

第一层面着重于了解不同用户在各通路的使用行为,以及他们对于通路的偏好为何。为了达成此目的,必须利用用户在玉山银行储存的帐务资料以及客户属性。洪采襄解释,帐务资料包含存款、贷款、每月刷卡金额,以及基金、理财投资等财富管理金额。顾客属性资料则包含年龄、性别、职业,以及薪转户等资料。j3A我酷网

而玉山银行资料仓储内有数百万笔此类资料,她表示,玉山团队使用了逻辑迴归模 (Logistic regression model),来预测每一位顾客在不同通路中所使用的相对机率为何,例如ATM、分行、客服中心、行动银行、以及网路银行的使用机率。j3A我酷网

经过比对之后,洪采襄得出了几个有趣结论。像是频繁使用者实体分行通路的用户,通常是年纪长、存款数目高的使用者,「不过公教人员使用分行的比例较低。」她也发现除了网路银行,其他通路大多得不到公教人员的喜爱。j3A我酷网

根据此观察,她认为,必须思考过去玉山银行针对公教人员的行销管道,大多是透过电话、EDM、DM,或是简讯等较高成本的沟通渠道。在了解公教人员的使用习惯后,未来就可以直接将促销方案放置于网路银行平台上,除了可以节省成本外,也能更直接地进行促销。j3A我酷网

而拥有较高资产的理财会员客户,使用实体分行、客服中心的比例也都偏高。她解释,理财会员大多喜欢透过行员、客服人员当面提供服务。j3A我酷网

至于信用卡刷卡金额高的用户,使用客服中心、行动银行的机率都比较高。不过,客服中心碍于人力问题,提供服务的成本比起行动银行要高。因此,透过此研究成果,玉山银行可以先统计这类顾客经常打电话查询的问题为何,再将这些资讯公告于行动银行,「渐渐地将顾客引导至行动银行上,藉此降低客服中心的人力成本。」j3A我酷网

用数据了解不同分行的通路特质和差异j3A我酷网

在比较过用户跨通路使用行为以及偏好后,洪采襄发现分行的使用比例仍然偏高,而目前玉山银行正处于分行数位转型的阶段,分行正面临裁撤、转型、合併,使得数量减少过程中,玉山银行也得试图降低对于客户产生的影响。因此,玉山银行资料科学团队,从跨通路比较中,更进一步地深入分析各个分行特质间的差异。j3A我酷网

就如比较使用者跨通路行为,解析分行特质也会使用用户在玉山银行的帐务资料,并且找出其使用频率较高的分行进行分析。j3A我酷网

假设某用户在某一段时间内,总共使用了A分行10次、B分行3次,以及C分行3次,即可得知其最常与A分行往来。更进一步,也要了解最常前往该分行用户的财务状况,像是财务管理、刷卡、存款、贷款的额度等资讯。洪采襄表示,此类资料若用报表呈现,由于数据过多,不易从中判读有意义的资讯。因此,资料科学团队便将分行资料进行主成分分析,将多维度资料降级成二维度的资料,「这样比较利于视觉化。」j3A我酷网

j3A我酷网

用2维图表呈现多维资料j3A我酷网

玉山银行将全台湾分行一同进行比较,而各分行在顾客资产、顾客负债都有不一样的表现。j3A我酷网

洪采襄也指出,分析后可归纳出两项主成分,第一种是偏向反应用户资产状况,包含存款、财富管理。第二种则是负债程度,可用来代表其负债面状况,像是贷款、刷卡金额。多维资料降级二维资料后,资料科学团队以客户资产面作为横轴,用户负债程度作为纵轴,将各个分行数据纳入来比较各自的特性。玉山银行还将台湾画分为东、西、南、北四大区域,作为比较南、北差异或东、西部差异的另一个分类向度。j3A我酷网

利用此图,也能看出某些分行用户持有较高资产,例如理财、存款。反之,某些分行用户则拥有较多负债,像是信用卡消费、贷款需求。此图中,洪采襄也发现,南北部分行的特质也颇符合传统中的印象,例如,南部居民理财行为偏向保守,除了存款比例偏高外,也通常购买投资报酬较稳定的理财商品,而北部居民则较常利用信用卡购物,贷款需求也偏高。j3A我酷网

不过,只用4大地理区域的比较,尺度仍旧太大。玉山银行更进一步从缩小到地理区域中的特定行政区,进一步比较行政区内每间分行的特色。例如,洪采襄发现北部某行政区中的4间分行,有2间分行不论是客户资产、负债数值表现都相当不错,但是其余2间,用户的资产数目就表现较普通。她解释,行政区内被画分为商业区、住宅区,或是交通枢纽。而由于分行处于不同交通位置,导致各分行特性不同。j3A我酷网

寻找邻近相似特质的分行j3A我酷网

除了分行的差异,玉山银行也想要了解各分行间的相似程度。洪采襄表示,除了用二维图表来分析外,玉山也利用分群技术,如根据存款、信用卡、贷款,以及财富管理等四构面,并且用颜色来呈现各分行之间的相似程度,来提供更直觉的视觉化呈现。j3A我酷网

例如,若想要台北将近30间分中,其中两间的特性时,则在横轴寻找A分行,纵轴则找到B分行,在相似度矩阵中寻找A与B的交集点。j3A我酷网

若此交集点的颜色愈偏红色,代表A、B的相似度越高。反之,如果交集点偏向黄色,相似度则比较低。此外,在相似度矩阵中,也可以利用分群,将特性相似的分行绘製在相邻区域。j3A我酷网

j3A我酷网

用颜色渐层反应相似度j3A我酷网

玉山也用红黄两色渐层,将相似度视觉化。如在相似度矩阵中寻找A分行与B分行的交集。交集点的颜色愈偏红色,代表A、B的相似度越高,反之,如果交集点偏向黄色,相似度则较低。j3A我酷网

结合外部开放资料及内部营运资料j3A我酷网

洪采襄表示,除了内部营运资料,玉山银行也在思考是否还有其他资料能介接使用。恰好在2014年,前行政院院长毛治国祭出科技三箭:开放资料、大数据,以及群众外包。她表示,在政府、民间团体协力下,政府开放资料也越来越步上轨道。因此,玉山银行团队主管丢给洪采襄一个难题:「银行内部资料能否跟政府开放资料互相串接?」j3A我酷网

洪采襄表示,目前玉山银行只串接了两种开放资料,包括了乡镇区总所得,以及乡镇区人口数的资料集。利用这两个资料集,资料科学团队就可以得知某一分行服务範围内的总所得、总人口数,并且推算该分行用户所得跟存款间的转换率,以及分行在其地域的占有率。不过,首先要釐清玉山银行在全台湾136间分行,每一间的潜在服务範围究竟有多广。j3A我酷网

洪采襄表示,透过空间分割法沃罗诺伊图,将尺度範围缩小,假设某行政区有数间分行,而该区的任一点,必定可以找到与它距离最近的分行,依此类推,计算该行政区内每点与分行的距离,资料科学团队就可以细分每间分行的服务区域。j3A我酷网

找出分行的服务区域之后,就可以计算分行潜在服务顾客的总所得情报。洪采襄举例,像是A分行潜在服务範围总共横跨4个乡镇,按分行服务区在每个乡镇的面积比例作为加权参数,对这4个乡镇公开资料中的居民所得来加权计算,如A分行服务区只涵盖甲镇的面积40%,就把所得平均值乘以40%,如此算分行服务区的整体所得平均值,进一步乘以涵盖人口数,就可得出A分行潜在服务範围的居民平均总所得。再和A分行存款资料相比,就可以知道居民所得,和来玉山银行存款的转换率多少,来採取适当对策,如发现该行存款转换率偏低,代表居民存款意愿较低,则可以多推相关理财行销方案,来提高顾客投资理财额度。j3A我酷网

用空间分割法计算分行服务区j3A我酷网

透过空间分割法沃罗诺伊图,找到某分行的潜在服务範围,假设某行政区有数间分行,而该区的任一点,必定可以找到与它距离最近的分行,反过来划分出每个分行的服务区,进一步再找出全台各分行的服务潜在範围。j3A我酷网

分析各分行营运状况不佳的原因j3A我酷网

除了计算分行潜在总所外,利用同样加权平均概念,也可计算潜在可服务的人口数量。洪采襄举例,若甲分行理论上应可服务10万人,但是经常服务客户却只有2万人,就可考虑要求甲分行应该要更努力地吸引客户,不过也可能是同一个行政区中,同业竞争者比玉山银行来得更有吸引力,就得另外找对策。j3A我酷网

此时,资料科学团队也能够寻找距离甲分行最近的数间分行,比较甲分行与他者的相似度为何。洪采襄举例,如甲分行才刚成立不久,消费者通常习惯前往以前的分行,因此才导致该行的存款数量不足。j3A我酷网

或是比较同区域的分行,观察到乙分行表现特别好,这时可能因为该分行位于商业区,客户前往该地的难易度较低,导致其业绩胜过其他分行。j3A我酷网

可用来预测顾客特质,量身打造促销方案j3A我酷网

从比较用户在跨通路行为,到各区域分行的异同,最后玉山银行则要将分析单位缩小至每一个消费者,在了解不同用户习惯、特质后,推出客製化服务,这时候信用卡的消费明细纪录就可以派上用场。j3A我酷网

洪采襄表示,由于消费明细的资讯过于複杂,包含日期、地点、金额等资料,所以得先简化,例如玉山只选定旗下顾客最常光顾的1万间商店作为标的,再用二进度来呈现消费情况,1代表有,0是没有,标记出一位顾客有无在这一万多家商店中消费的记录。j3A我酷网

不过,每一位消费者的购物记录是长达1万个字元的字串,「这样的变数分析还是相当困难。」因此,玉山团队再用主成分分析方法,来降低变数的维度,搭配逻辑迴归分析,藉以预测顾客身份,像是性别、职业,或是VIP会员等。j3A我酷网

洪采襄举例,当A明细记载着该消费者往往在加油站、3C购物商场消费时,按照常理推断,很容易联想到该消费者的性别为男性。反之,当B明细多记载药妆店、百货公司的消费记录时,亦可以推断该用户为女性。j3A我酷网

j3A我酷网

用分群分析顾客消费特性j3A我酷网

当左边明细记载着该消费者往往在加油站、3C购物商场消费时,按照常理推断,很容易联想到该消费者的性别为男性。反之,当右边明细多为药妆店、百货公司的消费记录时,亦可以推断该用户为女性。j3A我酷网

再者,许多和玉山银行往来的公教人员,使用国民旅游卡的比例偏高,所以当一个消费明细中,出现许多相关特约商店如福华大饭店、台湾中油、农会时,也可以推断其极为可能是公教人员。j3A我酷网

最后则是理财VIP会员以及高资产会员,其消费大多集中在保险投资、海外旅游、房地产,以及奢侈品,「因此,只要分析玉山银行的消费明细,就可以猜到顾客的特质。」目前在性别预测上,玉山银行可以达到将近9成(88%)的预测水準,而是否为公教人员、理财VIP的预测正确率也都突破了8成。j3A我酷网

在了解各个消费者特质后,玉山银行也可以给予不同的客製化服务。洪采襄表示,像是近年相当流行分析用户点击行为。若可以藉由点击行为锁定特定客户,即可以推荐适合的行销方案。她举例,若该用户经常常常点击汇率、旅游平安保险的按键,此时就可以推测他是否有旅游需求,以提供相关刷卡零利率的优惠方案。j3A我酷网

j3A我酷网

上一篇  下一篇

I 相关 / Other

鸿海促夏普投资OLED△后年Q2营运

鸿海投资夏普后,推动夏普布局新事业。夏普今天公告,将投资574亿日圆布局OLED先进产线,预计2018年4月到6月开始营运。夏普今天召开董事会决议,投资有机发光二极体先进产线,其中将投资574亿日圆引进OLED面板基板、

寻找CRAZY GIRLS|“星座女神”等你来参加

寻找CRAZY GIRLS|“星座女神”等你来参加
甩张奖品图!重温一下第一季第二季的精彩粉丝风采!报名方式也是非常简单,继续甩图!是什么支撑你在祖国母亲生日的前二天还在工作?



是对领导的眷恋!

少年约架发红包喊快来 [热事件]

近日,家住重庆彭水的张某和冉某,因为琐事约架,结果张某带着兄弟赴约时却没有打车钱,着急一战的冉某竟然给对方发了个微信红包,好让对方准时应战。这就是文章说要讲的少年约架发红包喊快来事件,事件发生后,29日

台化:彰化厂连亏5年 营运考量员工生计

台湾化学纤维公司副董事长洪福源表示,彰化厂 5年亏新台币17亿元,营运考量在于工厂近 1千位员工,平均都48岁了,如何叫他们离乡背井,到其他地方工作。洪福源今天在记者会指出,彰化厂人事成本 1年13亿元,扣除给政

脱欧效应 3/4英国大老板考虑营运外移

根据今天公布的1项调查,在英国公投脱离欧洲联盟后,有3/4英国公司老板正在考虑要将营运转移到海外。路透社报道,安侯建业联合会计师事务所调查英国100家营收1亿到10亿英镑的企业总裁,发现其中86%对所属公司成长展

I 热点 / Hot