首页 » 行业声音

【中信银行信息技术管理部总经理 王燕】攻坚克难 加快分布式架构转型

时间: 2017-08-09 14:21     浏览次数:119    来源:未知


文 \ 中信银行信息技术管理部总经理  王燕


实现从传统商用技术和架构向开放、开源、分布式系统架构转型,关系到银行业的生存和发展,是中信银行“十三五”期间信息科技工作的主要目标和重要任务。架构和技术转型,能够有效支持业务创新,为全行积极参与未来竞争不断集聚技术动能。同时,在自主研发分布式数据库方面,希望能为同业架构转型提供有益方案。

 

架构转型的意义
 

1. 分布式系统架构是技术发展的趋势

随着互联网和云计算服务的快速发展,作为其主要技术的分布式计算、存储和应用技术正在成为当今信息科技的主流。分布式系统架构不仅具有可扩展性强、处理效率高、容错能力强等特点,更为重要的是,它还是大数据、机器学习、人工智能、区块链的支撑技术。目前,国内外金融机构都在积极、审慎地开展私有云建设,研究并尝试开源、分布式技术和应用。

 

2. 架构转型是银行生存和发展的迫切要求

首先,生态化、场景化的金融服务,以及数字化、智能化等技术,已经对银行的支付、征信、风险技术、理财、客户获取等核心领域产生极大冲击,互联网技术创造了平台经济、共享经济,也推动着金融服务模式的创新,银行不加快技术转型就会被未来淘汰。其次,从中信银行战略看,是以开放、合作、分享的理念和态度参与到互联网金融生态中,因此必须要有开放的技术体系和架构与合作者联接和交换,现有的闭源架构在一定程度上限制了银行业务的合作范围、扩展性和效率。第三,从成本和效率上看,开源、开放的分布式技术成本更低、效率更高、用户体验更好、开发和测试方法更为敏捷。

 

3. 架构转型是适应我国金融业安全可控趋势的迫切要求

以X86、开源为特征的技术体系,有利于我国信息产业企业和银行业掌握技术,从而改变我国银行业长期以来基础软硬件等核心技术完全依赖国外厂商的状况,适应国家网络空间安全战略要求。

 

中信银行架构转型目标和实施步骤
 

1.架构转型目标及实施策略

中信银行高管层对互联网、云计算、大数据有着敏锐洞见。自2013年开始布局云计算、大数据、分布式数据库等互联网新技术应用研究,投入资源,组建专职团队,规划中信银行私有云架构,开展相关技术的研发和落地实施工作。以开源、开放的分布式架构为转型的重要推手,扎实推进银行IT架构转型各项工作。在前期研究和试点基础上,2016年初,基于我行的发展愿景和科技兴行战略,全行“十三五”信息科技发展规划进一步明确:完成向开放、分布式架构转型,建成组件化、服务化、移动化的应用架构,完成核心系统的下移。搭建支持在线、离线和实时数据服务的混合数据架构,提供精准化管理和智能化服务。打造弹性扩展、快速部署、高可用、低成本的“中信云”,建设随需应变的基础设施。

 

我们清醒地认识到,架构转型是一个复杂的过程,需要采取循序渐进的实施策略。

 

一是坚持架构规划先行。确定分布式架构为架构转型的最终目标,建立专职实施团队,制定架构转型原则,明确架构转型实施路径。

 

二是坚持“研发应用相结合”。以新技术启发创新型应用,以业务需求指引技术研发,边研发、边释放,成熟一批、上线一批,逐步推进新技术落地。

 

三是坚持“先管理后交易系统、先外围后核心系统”。以分布式、大数据应对海量高并发的计算需求,从传统技术和云计算技术相结合的混合架构逐步过渡到开源开放的分布式架构,以积极稳妥的步骤推动IT架构转型。

 

2.架构转型实施步骤和成效

一是制定架构转型规划。2013年开始,我行组织人员研究互联网企业的最佳实践,并根据我行的业务发展实际需求,研究制定中信云平台的整体架构规划。新一代的技术架构平台以硬件资源池化、基础软件开源化、软硬件资源灵活调度和弹性供给为基本特征,采用大数据处理、分布式计算、实时智能分析等最新的云计算技术,构建软件基础平台。按照“搭平台、建队伍、上应用”的执行步骤,踏上转型之路。

 

二是从大数据平台建设和应用入手。2014年,搭建了基于开源Hadoop技术的企业级大数据平台,引入开源技术组件10余项,完成大数据生态的整体部署。经过3年建设,平台已经实现了行内外数据、结构化与非结构化数据的采集、存储与分析,搭建了在线精确查询、离线批量加工、实时事件处理、内容管理、大数据挖掘等5个平台,支撑了交易风险控制、对客精准营销、用户行为分析、智能投顾和人工智能等创新型应用。让交易数据在前中后台之间“动起来”,让沉睡的历史数据在分析系统中“活起来”,消除技术壁垒和数据孤岛,充分发挥数据资产的价值。

 

三是分步骤推进“中信云”基础设施建设。建设了云数据中心,实现了中信生产和测试“两朵云”的建设目标,开展了容器项目的预研。

 

在生产云中,按照“云数据中心”理念,重新规划基础架构,进行机房布局、高密机柜选择和大容量设备选型,大力发展平台化运维、自动化运维、智能化运维,稳步推行开源产品,加大新型运维团队的培养,设计了基于云计算的双活中心、灾备中心架构。2016年11月,全行管理类信息系统100%接入云平台,平台包含142台X86服务器,节约了1445台物理机,120个机柜空间。

 

在测试云中,包括170台X86服务器,运行了1632个虚拟机,节约了1462台物理机,110个机柜空间。完成了测试环境的100%纳管,同时向分行开放了开发测试资源,完成了配套的规范、流程建设,提供了30多种涵盖中间件、数据库部署需求的云服务。

 

“两朵云”在试点阶段就取得了显著成效。“生产云”累计节约6500万元的服务器采购成本,每年节省1440万元的机柜租赁成本。同时,总行云平台向分行提供互联网特色应用云服务,满足了分行迫切的互联网出口需求。“测试云”累计节约6200万元的服务器采购成本,每年节省1320万元的机柜租赁成本。测试环境虚拟机部署效率提升50%,环境准备时间缩短一半。

 

2016年,我行还开展了容器项目预研,基于DevOps的理念,进行了容器云的系统规划、场景设计、产品选型和POC测试。实践过程中,中信银行坚持从实际业务需求、运维需求出发,将实际需求与容器云最佳实践相结合,在微服务、应用容器化改造、弹性扩展、灰度发布等方面,进行了深度研究和实践。

 

中信银行云平台的实施,实现了强健稳定、弹性伸缩、开源开放的基础架构平台,为中信银行云平台战略的实现打下了坚实基础,为后续的PaaS平台建设提供了坚实的技术支撑。后续我行还将进行SDN对接、存储自动化管理、PaaS平台对接等工作。

 

3.大胆尝试分布式数据库研发和试点

在实现架构转型过程中,我们必须实现数据持久化层的分布式,但这恰恰是分布式架构中技术难度最大、最为关键的部分,在银行同业没有先例可以借鉴,因此我行决定自主研发分布式数据库。经过3年时间,我行的分布式数据库已经具备事务实时一致性控制、集群高可用切换、联机在线重分布和数据库备份恢复等关键能力。目前正在进行二期项目研发,届时将具备更完善的分布式事务控制能力、日终批处理能力、在线扩容能力、问题诊断能力以及更高的并发处理能力。我行的分布式数据库已经在冠字号系统、中信银行新门户和金融同业合作平台试点成功,截至目前运行平稳。综合零售积分项目正在进行压力测试,也将于近期上线投产。

 

4.2020年完成两大“核心”群的迁移

2017~2020年,是我行架构转型的关键实施阶段。一是计划用3年半时间将信用卡中心目前基于AS/400的核心系统Semacard,以及其他外围系统全部迁移到分布式技术架构。二是计划在“十三五”期末,完成核心业务系统从IBM AS/400小型机向基于X86平台的分布式架构的迁移。三是围绕上述两项重大任务,搭建PaaS平台。以两大“核心”迁移项目投产为标志,推动架构转型目标达成。

 

转型难点及对策
 

尽管分布式系统架构成为趋势,但是银行业要实施架构转型,在思想观念重塑、团队能力建设、技术难点攻关等方面尚存在巨大挑战和困难,必须采取强有力的措施攻坚克难。

 

难点一:思想观念转型难度大

思想是行为的先导。长期以来,银行信息科技团队将确保客户和银行的资金安全作为恪守铁律。使用最成熟、稳定的技术,保证系统交易的实时一致性,是银行信息技术部门的基本工作原则。因此,银行架构无一例外地选择使用以IOE为代表的成熟、稳定、具备良好技术支持保障体系的“经典”商用软件和体系架构,并培养了大批熟悉应用相关技术的优秀技术人员。分布式架构与传统架构相比,在架构、设计、开发、运维、管理上需要有不同的思维和技术能力,这对我行现有技术团队的思想观念和思维模式造成巨大冲击,需要有一个“脱胎换骨”的转变过程。

 

对策:一是虚心向掌握新技术的互联网公司学习,开展技术交流与合作。二是建立云计算、金融IT产品创新实验室专职研发团队,通过小团队的研究、创新、试点和培训,以点带面。三是应用新技术解决业务痛点,让技术团队和业务部门真切感受到新技术的好处,理解和支持技术转型。第四,也是最为重要的一点,我行高管层高度重视和支持架构转型工作,给信息技术部门留出一定的转型时间、资金,以及试点和试错空间。

 

难点二:缺乏掌握新技术的人才

开源技术同样需要技术支持,但是与传统技术发展路径不同,云计算技术专家大多集中在互联网公司。由于开源技术的变化很快,研究这些技术的大多为创新型公司,一般规模小、不稳定,难以提供持续、稳定的技术支持,并且缺乏对银行应用特点的理解和实践经验。银行必须培养和拥有一批既掌握新技术又有丰富银行应用经验的技术人才,而银行现有的招聘、薪酬和激励机制,不足以吸引此类紧缺人才。

 

对策:一是高度重视并积极尝试建立吸引和留住信息科技人才的机制,建立信息科技专业技术岗位序列,让专家型技术人员有良好的发展空间。二是通过制定转型目标、针对性的培训、项目实践、评估阶段效果等措施,有计划、有步骤地循序渐进,目前已取得了一定成效。三是积极开展与国内有实力供应商的合作,改变单纯的甲乙方关系,联合开展技术难点的研发和攻关,共同培育市场化的服务支持环境。

 

难点三:数据持久化层的技术难点

在银行IT架构向分布式架构转型过程中,最大的技术难点在于“数据持久化层”的分布式。相比之下,应用逻辑层和接入层的分布式架构已经很成熟,在银行内已经得到广泛应用。之所以说是难点,是因为数据是有状态的,特别是银行核心系统保留的账务数据,在交易过程中会被不停地更改,这部分数据一旦被分布到多处存储,就会造成更改信息的不一致、更改信息不可见、读取信息不准确等一系列问题,也就是我们技术上经常说的分布式事务下数据一致性、隔离性、原子性和持久性的问题。

 

对策:为解决上述技术难题,我们在分布式数据库中研发了“全局事务管理器”和“分布式隔离级别”。前者很好地解决了分布式事务一致性和隔离性问题,但仍然没有突破CAP理论,处理性能会受到影响。为解决性能问题,我们又研发了“分布式RR”和“分布式CR”两个隔离级别,对明确不会产生分布式事务、不受分布式事务影响的请求,我们可以指定“分布式CR”隔离级别,从而确保分布式数据库的整体处理性能。

 

几年的实践,充满困难、曲折,有质疑、犹豫,也有成效和欣喜。随着转型工作向银行关键应用的推进,难度、风险和挑战将越来越大。对此,我们在战略上坚定不移,在战术上高度重视,稳扎稳打,步步为营。更加虚心地向互联网企业学习、向金融同业学习,开放合作,力争在保障银行信息系统稳定、安全运行的前提下,顺利完成架构转型。