所有产品

大数据需要“精加工”

  如今,数据的获取变得越来越容易,但如何利用这些数据,充分发挥数据的价值却并不容易。尤其是在金融行业,“玩不转数据就玩不转金融”的说法得到大多业内人士的认同。大数据时代的到来,带来什么样的变革?

  “大数据如同透视一切的魔镜或者预知未来的水晶球,收集尽可能完整的相关信息,运用专业知识和相关经验去进行逻辑判断,通过这个过程可以降低投资的风险,提升判断的准确性。黄金城彩票,”中国银联旗下专业从事大数据咨询与服务的子公司——银联智策总经理赵萌的观点非常鲜明:“大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的‘加工能力’,通过‘加工’实现数据的‘增值’。

  近日,赵萌接受本刊记者采访,围绕如何将大数据分析打造为核心竞争力的问题畅谈了自己的真知灼见。

  在过去的5年里,互联网金融在金融服务领域经历了爆发式的增长,导致这个局面的主要外因是中国市场存在巨大的机会。

  “以信用卡业务为例,2008年美国银行在美国的信用卡未清偿余额达到2000亿美元,同时期,中国整个银行业的信用卡未清偿余额总和都达不到2000亿元人民币。”赵萌告诉记者:“资本关注这个领域的另一个原因是金融业务发展的内因,人们愿意相信依靠大数据分析可以支撑一种基于互联网的金融新业态。这个领域内的翘楚—第一资本银行(Capital One)就是这样一个典型。

  第一资本银行以数据分析为核心的运作模式取得了巨大的成功,从几位咨询顾问“承包”一家区域性银行的信用卡业务起步,用了20多年的时间,在一个相对饱和的成熟市场,发展出了美国第五大银行。

  5年后的今天,中国在个人和小微企业金融领域已经有了一定的发展,上升空间依然很大。赵萌说:“经常能够听到某某刚成立的互联网金融机构采用了一些大数据手段很快就使放贷规模达到100亿人民币。似乎人们已经慢慢习惯了这个领域的大规模的洗牌”。

  是大数据分析不灵验,还是很多企业没能做好大数据分析呢?作为中国领先的大数据智能策略服务商,银联智策在传统金融和互联网金融领域拥有广泛的客户。赵萌表示:“从我们和金融机构长久以来的合作经验看,中国的金融机构大多认同大数据分析的价值,但是很多机构并没有把大数据分析作为核心竞争能力去全力打造,或者对这件事情的复杂性估计不足。事实上,数据分析的链条很长,数据获取只是第一步,需要打通全链条才能最终产生价值。从数据获取开始,需要经过数据环境、数据分析、商务分析和决策机制这几个环节。”

  数据获取,是目前人们讨论最多的话题,大家一方面希望打通各个数据源,另一方面却又无法回避隐私保护的问题。对此,赵萌表示:“严格意义上讲,任何个人信息都属于个人隐私范畴,获得这些数据,必须获得本人的合法授权。其中,一部分个人数据在其办理各类金融业务的时候进入了传统的个人征信数据库,剩下的大部分都属于非征信数据,而大数据概念的出现,极大程度上拓展了非征信数据的边界。”

  征信,至少在美国是一个受到法规严格界定的领域,提供的颗粒程度可以是非常具体的,什么数据可以收集,什么数据可以在什么情况下使用,均有非常明确的规定。

  那是否就意味着大数据无法合法合规地使用呢?赵萌告诉记者:“对于非征信数据源,一种比较合理的方式是根据其数据特性对个体做一系列相对宏观的判断,由数据使用方评估这些判断是否有价值。比如,采用评分的方式对人进行数据画像,既避免了个人隐私数据的透露,又能让金融机构完成对借款人必要的‘认识’。”

  由于这些宏观判断需要评估,非征信数据源的覆盖面和可验证性就显得格外重要。赵萌说:“比如银行卡组织的交易数据,覆盖人群广,可验证的渠道较多;而在单一互联网上的行为数据,覆盖用户相对集中,很难进行交叉验证。比如一些独立的游戏网站,客户在其上面的行为数据,只有网站自己知道,无法通过其他渠道进行验证。”

  从以上分析不难看出,即使不考虑采购数据的成本,在这个市场上能够获得的法律风险低、效果好的数据其实屈指可数,而金融机构最常用的传统数据源—交易数据,就是其中的代表。

  赵萌告诉记者:“我们银联智策担负着在这个领域和国际卡组织对标的责任,用3年的时间完成了对方10多年的工作,对跨行交易数据进行了系统的清洗,实时监控数据的质量和变化,千锤百炼出了多个系列的模型,既可以从风险水平、财富能力、社会地位、消费偏好全方位的对持卡人进行画像,也可以从商业前景、市场地位、经营状态、客群品质对商户进行描述,还观测着上百个细分行业的经营动态和发展脉络,力争把交易数据的效果发挥到极致,方便客户的使用。从实际效果来看,银联智策开发的数据产品对于众多金融及行业客户降低金融风险已经起到了至关重要的作用。”

  数据环境,是一个技术发展非常快的领域。一个公司如果要做好大数据运营,必须综合考虑机房、设备等硬件环境和架构、安全、数据库、分析软件等软件环境,必须不间断、有计划地投入。大数据对数据环境的冲击是颠覆性的,高性能服务器和大规模数据库的组合已经愈发捉襟见肘,开放式的开源Hadoop平台逐渐成为了大数据分析的标配。但是,新型的开放式开源大数据平台需要根据企业自身的业务形态进行个性化的开发和部署,并没有可以“即插即用”的模块化商业解决方案。

  因此,赵萌表示:“基于这样的平台开发的数据环境需要比较漫长的开发和优化过程,没有多少现成的经验可以借鉴,只能靠自己逐步积累。这是企业大数据运营的难点和重点,也是为何只有专业的人或机构才能做好大数据运营的重要原因。”

  量化分析是大数据的重要一环。一类是基于统计的建模,这套方法在服务器和数据库的分析系统上普遍应用,通过抽样后的数据样本训练模型,再部署到全量数据上去应用。另一类是基于机器学习的数据挖掘,非常适合Hadoop的架构,是人工智能的基本套路。

  赵萌表示:“任何数据分析方法都是和数据本身的特点以及数据分析环境的能力直接相关的,需要在计算效率、准确性、存储空间上做权衡。比如,银联智策的交易反欺诈模型,需要在0.1秒内判断任何一笔跨行交易是否存在欺诈交易的可能性。中国银联累计发行了50多亿张银行卡,一年的交易几百亿笔,遍布全球,单纯使用以上任何一种方法都难以达到最优。分析人员要在预测的算法精度与完成预测所需要的存储空间以及运算资源之间综合考虑,权衡不同的预测算法与组合方式,创造性地达成高速高效高精准的分析目标。因此,任何一家企业在开展大数据分析时,都需要根据自身不同的情况挑选合适的方法开展实施。”

  应用策略分析往往是大数据分析成败的核心。俗话说:没有完美的数据,只有千变万化的场景。在开始的时候,需要具体情况具体分析,整合必须的数据,搭建分析的逻辑框架,根据现有数据环境的能力和量化精度的要求明确数据分析的目标,形成解决问题的方案。

  通过对执行结果的观察和分析,不断完善和改进,进而找到最佳的方案。在此过程中,找到处理此类问题的规律,逐步标准化、自动化,提高效率和效果。赵萌表示:“不难发现,如果说数据环境和数据分析需要的是专才,商务分析更需要的是通才,特别是对业务的理解和经验。举例来说,当我们通过数据分析手段发现某家银行的信用卡的整体透支额度上升后,我们应该做什么?是立即得出该银行的营销策略做得好这一结论,还是作横向比较,看看市场整体情况如何再作判断呢?同样的数据结果,给不同的分析师看,得出的结果可能是千差万别的。”

  赵萌告诉记者:“《哈佛商业评论》上曾有篇文章提到,数据科学家是21世纪最性感的职业,数据环境和数据分析的专才在市场上已经是炙手可热了,商务分析的通才更加需要在熟悉业务的同事中培养。最理想的状态是使大数据分析成为一家企业全体员工的思维方式,在金融机构中形成文化。我们为金融机构做过很多驻场的咨询项目,在帮助客户解决实际问题的同时,做好知识和经验的转移,坚定整个市场使用大数据分析经营金融业务的信心。”

  决策机制,为大数据分析经营模式提供了运行的保障。赵萌告诉记者:“目前,国内的一些金融机构对于数据分析的理解还只停留在写报告的程度上,而第一资本银行在十多年前,数据分析链条上的相关员工就已经占了总数的大半,他们把数据分析的流程和成果嵌入到每个运营的环节中,并在做强核心分析能力的同时,逐步把一些辅助的服务外包出去,购买数据分析产品补充能力的不足。第一资本银行又创造性地把风险、市场、产品这样的核心分析部门以客群为单位去组织事业部,形成合力,让数据分析驱动业务发展。同时,他们又极富耐心的让数据分析人员去试错,去积累经验,不急功近利的为了达到某个指标而放弃相信数据的原则。这些都是非常值得我国的金融机构和企业借鉴的。”

  大数据分析对于中国的金融业乃至所有行业都会是一场革命。赵萌表示:“如今,我们逐渐从‘利差红利’走出来,单纯的营销关系和技巧也已不再是通往成功的‘万能钥匙’,日益变化的社会发展现状逼迫我们必须具备快速准确地发现问题、迅速有效地解决问题的能力,这就需要我们认真打造大数据分析的核心竞争力去直面金融及行业的本质—数据创造价值,策略提升效率,创新引领变革。”