
![]() 现代化的数据架构助力提升银行业务价值 | 概述
mBank S.A.成立于1986年,是波兰国内领先的金融机构之一,同时也是商业银行集团(原BRE - 出口发展银行)的成员。以资产总额衡量,mBank银行是波兰第四大银行,为波兰全国410多万零售客户和19,562家企业客户提供服务,并且为捷克共和国和斯洛伐克两国共80多万零售客户提供服务。mBank银行提供零售、企业、投资银行业务以及其他金融服务。 多年以来,mBank一直是创新银行业务解决方案的代名词。2000年,mBank在波兰推出了第一家完全基于互联网技术的网上银行。目前,该银行的主要业务重点是手机银行和网上银行业务发展。
Cloudera平台为mBank提供了针对所有数据的集成存储、处理和分析功能。这将支持新型的数据利用方法,使mBank能够提高市场竞争力,并允许更有效地利用mBank现有的IT基础设施。 |
“能够访问所有数据意味着我们第一次可以部署这么多的应用程序。同时因为大多数数据将在Cloudera中可用,而不是传统的数据仓库,因此我们还可以节省资金。”
- Artur Szymansk,mBank公司IT基础设施、数据仓库和数据科学部门负责人 | 影响
Cloudera企业版已经成为mBank的中央数据中心,极大地提升了其性能。例如,mBank已将其日数据集成处理降低了66%。 “过去我们需要24小时,而现在我们仅需要8小时就能完成整个处理,同时我们坚信其性能可以进一步提高,最终可能只需要在4个小时内就可以获得数据,”mBank数据仓库和数据科学部门负责IT基础设施的Artur Szymanski说到。 有了这种现代化的数据架构,mBank也降低了其营运成本,并开始提供对数据的访问和集成服务,而这一点在缓慢的传统环境中是无法实现的。“能够访问所有数据意味着我们第一次有机会可以部署这么多的应用程序,”Artur Szymanski说,“同时因为大多数数据将在Cloudera中可用,而不是传统的数据仓库,因此我们还可以节省资金。” |
业务驱动因素
mBank拥有超过50个应用程序和系统,5000多个工作站,以及数百万用户所生产的数据。mBank成立于1986年,因此其基础的传统IT系统不再能够跟上不断增长的数据量的需求。 特别是涉及到数据科学时,现有的企业数据仓库基础设施是不堪重负的。因为集成和处理数据所需的时间,公司员工以前习惯于使用前一天的数据。这使得数据科学成为问题,因为无法找到足够的原始计算能力。 | |
关键要点
行业 • 银行业 • 商业智能(BI) 影响 • 将每日数据集成处理减少了2/3 • 将查询时间加快了4倍 • 通过对当前数据的分析,帮助银行 拓展其市场地位 • 实现新应用程序的部署 数据来源
• 源系统(主要是网上银行交易系统)的平面文件 • Oracle DB • IBM MQ • 其他本地Apache Hadoop集群 使用的技术
• Apache Hadoop平台:Cloudera企业版数据中心 • Apache Hadoop组件:Apache Impala和Apache Spark •商业智能(BI)及分析工具:Oracle、IBM Cognos和Qlik • ETL工具:Informatica | 解决方案
在2014年年底,mBank开始寻找一个能够处理大数据环境的平台。mBank很快就发现,Apache Hadoop™是唯一一个能够应对这些挑战的系统环境。 “我们早已了解到Hadoop的框架和Hadoop分布式文件系统(HDFS)以及MapReduce算法能够很好地应对大数据时代的需求,”Artur Szymanski回忆说。 mBank成功地利用Cloudera企业版构建了一个现代化的IT基础架构,并且很好地驾驭了大数据。现在,mBank可以集成数据并使用超过300GB的数据快速填充数据仓库,并且可以同时访问所有数据源。此外,可以使用最新的数据进行分析和决策,数据查询完成速度也变得更快。这些功能助力mBank进一步扩大其市场地位。Artur Szymanski说:“我们发现,与Oracle数据仓库相比,某些查询的速度提高了四倍。 作为第一步,是将数据迁移到Hadoop。然后,与Cloudera紧密合作来改进数据提取、转换和加载(ETL)流程。与此同时,Cloudera企业版已成为mBank的中央数据中心,并且性能得到了大幅提升。 此外,mBank正在建立其数据科学部门,以充分利用集中式企业数据中心带来的优势。Szymanski说:“数据科学可以开展全面的分析,这对计算能力提出了很高的要求,并且需要快速访问大数据。“同时,借助Cloudera公司提供的MapReduce算法,Hadoop就拥有了另一张王牌。而这种计算能力在传统计算平台上是无法实现的。” |