金融科技创新联盟

首页 » 行业声音

华瑞银行副行长孙中东：金融业应用人工智能为何爆发式增长

时间： 2018-01-15 11:44 浏览次数：141 来源：未知

请点击此处输入图片描述

正文

人工智能（Artificial Intelligence，AI）是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程。业界普遍认为1956年在美国达特茅斯（Dartmouth）大学举行的一场学术会议为人工智能研究的起点，到2016年AlphaGo击败李世石，正好60年时间。已经研究了60多年的人工智能，何以突然在近些年如此的火热，迎来爆发式的增长？综合来看，主要有三方面原因：

首先，从计算力方面看，随着硬件成本的不断下降，以及大数据、云计算等“计算基础设施”的不断发展，人工智能所需要的强大算力已经得到保证。多层神经网络以及BP反向传播算法等，在1986年就已经问世，可见，人工智能需要的算法早已具备，只是计算力一直没有增长到足以支撑人工智能计算量的水平，即短时间内可进行海量数据的计算和反复迭代。如今，随着量子计算研究的不断进展，原有的冯·诺依曼体系架构面临突破，人类所能创造的算力还有可能进一步飞跃，届时人工智能想必还有更加长足的发展。

其次，人工智能算法本身也有长足发展。机器学习算法一般可分为三种：有监督机器学习（如回归、分类等算法）、无监督机器学习（如聚类、关联规则等）、增强学习或强化学习，人工智能前60年的研究主要集中在有监督学习上，即在给定样本情况下的机器学习，应用领域包括图像、语音识别、自然语言处理（Natural Language Processing，NLP）等。无监督学习与有监督学习相反，不给定样本，或者说数据没有标签，让机器自己推断出数据中的内在结构或关系，近年来随着金融等领域的应用，无监督学习的研究也有了很大发展。而增强学习的研究，则是以AlphaGo的横空出世为里程碑，在增强学习中，机器与外部环境不断交互，通过不断尝试，获取正向或负向的回报，根据回报的累计来学习最佳策略。可以看出，强化学习与人类或者说生物学习的过程是更加接近的，这也让人工智能更加的“像人”，而不仅是冷冰冰的机器和算法。

最后，产业界的强烈需求也促使人工智能应用的落地。各行各业的人力成本不断高企，计算成本逐渐下降，替代人工、解放劳动力的呼声愈发强烈；与此同时，每天全球各行各业产生的海量数据也成为人工智能应用的“粮食”。

综上所述，人工智能在发展了一个甲子后迎来最高速的发展期。

在金融行业，人工智能的应用场景主要在风控及反欺诈、精准营销、智能投顾和智能客服四个方面。其中，智能客服相对集中在NLP技术的应用上，与金融并非强相关，不在本文探讨范围之内。

风控及反欺诈

无论风控、反欺诈还是精准营销、智能投顾，都依赖于底层完善的用户画像体系及数据架构，这两者构成了金融机构人工智能应用的骨骼和血脉。在信用风险控制方面，金融机构早已应用逻辑回归等算法，也算是有监督机器学习，属于人工智能范畴。虽然算法较为简单，但是在坏样本足够丰富的情况下，算法的效果与神经网络等复杂算法相差不大，综合考虑成本及建模难度，逻辑回归等基础算法在金融业的信用风险防范领域成为了主流算法。而在欺诈风险防范领域，运用大数据及人工智能相关算法则更为广泛。常见的应用主要有：欺诈网络分析、行为模式识别、离群点分析等。

欺诈网络分析是指通过申请客户的社会关系数据（如紧急联系人、通讯录、通话记录、电子邮件记录），建立与现有黑名单/灰名单库的关联强度，预测申请客户的欺诈概率。根据社交关系网络，每个人都将衍生出一个N叉M层树，而每个人又置身于K叉L层树中。在这样一个关系网络中，一个人的行为受其他人的影响，即一个人实施某一行为的概率，取决于其关系人在该行为上的概率和该关系人对其的影响程度。基于此，可推断新申请人的欺诈概率取决于其直接关系人，直接联系人的欺诈概率取决于其下一层直接联系人，由此计算出申请客户的欺诈概率值。

此外，黑色产业链的一个重要环节就是：卡池（Simcard Pool）和猫池（Modem Pool）的联动操作，程序化操作有着比较规则的轨迹。机器行为识别将成为未来非常重要的一个环节。要识别机器行为，首先必须建立设备指纹算法，最常见的方法即通过mac、uuid、硬盘序列号等指纹信息作为设备全网唯一标识，用于同设备识别多账号注册申请。

对于伪造指纹的设备，要建立相应的黑名单机制，比如建立MAC、imei，甚至于proxy、geoip黑名单库，加强对虚拟机伪装等行为的特征识别和捕获。

接下来就是对设备的行为进行分析，以下现象需要重点关注：

同一时间段内“近似唯一信息段”数据激增：比如同一IP地址的申请、同一GPS位置的申请、相同手机陀螺仪参数的申请等。虽然存在一定的正常申请量，在实践中这类交易中伪冒申请的情况仍然相当严重。

多个客户的操作轨迹保持高度的一致性：比如页面操作简洁有序、时间间隔一致、停留时长一致、鼠标轨迹一致甚至缺失等现象。可以参考物理学上的傅里叶变换，机器行为在时域上表现出的一致性会掺杂在正常客户的操作中，但是转换到频域时，将会表现出显著的差异：正常操作呈现出散点状，而机器操作将会形成一个中心点，多个机器组织会形成多个中心点。而离群点分析，简单地说就是将单个客户的异常行为以及客群中的异常客户进行识别捕获。可以借助交易行为的数据维度，通过对单维度的频率分析、数据均值分布分析等方式，以及对多维度联合分布的分析，实时捕获到异常行为。

交易数据大多异常于真实交易：欺诈交易行为往往不具备真实的交易背景，通过对客户和商户的联合分析，可以识别出伪冒客户和伪冒商户，同时又能够补充完善规则库。比如，出现大额话费充值行为的客户和商户；大额整数交易的客户和商户等，在事后分析中都被判定为伪冒/套现交易。常用方法有基于统计、邻近度、密度、聚类的离群点分析和远离所属类中心点的样本（见图1、图2、图3、图4）。

请点击此处输入图片描述

精准营销

当前，银行在营销金融产品时，采用的是“广撒网”的全客户营销模式，即将一款或多款金融产品通过短信、电子邮件、柜台传单等方式向客户推销，而没有针对产品特性和客户特征做深入分析，导致没有产品潜在需求的客户也收到营销信息，不但浪费资源，而且降低客户体验。同时，银行也没有达到预期的营销效果。通过对客户的行为数据进行收集、打标，对产品信息进行分类、匹配，精准营销可以挖掘探索客户潜在业务需求，建立机器学习机制，通过A/B Test方式智能调整推荐结果，在最合适的时机提供用户最需要的信息，为用户提供更加舒适的购买金融产品的体验。

精准营销需要从客户角度出发，通过对客户特征的深入分析，借助机器学习算法模型实现建立以用户为中心的个性化的营销策略，全面系统地分析客户需求，帮助金融客户提升用户的忠诚度，为用户提供更加舒适的购买金融产品的体验。其次，精准营销也可根据产品特性，寻找到高匹配度的客户。此外，可根据收集到的客户购买行为数据，可以通过合适的渠道（客户使用最频繁的渠道或客户购买最方便的渠道），在客户信息接受度最高又或者客户购买概率最高的时段（合适的时间），将合适的产品传递给合适的客户。

推荐策略模块采用机器学习算法，根据客户行为数据及活动反馈，自主判断算法效果，自动调整模型参数，提供最优化的推荐结果。随着大数据精准营销项目的实施上线，此项目将会解决当前金融产品营销过程中盲目销售带来的资源浪费问题，从大数据技术的角度，通过机器学习算法等一系列先进技术和手段，改变现有的营销模式，实现个性化推荐、精准推荐，从而为业务发展带来质的提升。

精准营销业务主要是针对用户的行为、已有的认知习惯等数据进行挖掘分析，将符合用户个性及偏好的产品适时地推荐到用户面前。根据实时性要求的不同，选举引擎可分为在线推荐和离线推荐的营销方案。具体实现方案是基于用户购买、浏览等行为触发实时在线推荐，主要针对新增客户，采用支持向量机SVM，K近邻等先进高效的算法模型进行客群细分；或基于存量客户在一定时间内的历史购买记录、周围朋友选择等数据作为离线推荐的数据来源，采用协同过滤CF、关联规则Apriori等算法模型解决客户和金融产品的精准匹配问题用于推荐备选项。评分引擎将根据贝叶斯概率模型以及分类树模型确定最大购买概率推荐项。

智能投顾

如果将精准营销做得更加完善，从推荐单一产品到推荐投资组合，从推荐点击的“一锤子买卖”到推荐后持续跟踪组合收益，定期或根据特定条件触发组合比例调整，建立完善的投后跟踪机制，一个智能投顾产品便呼之欲出。

目前主流的智能投顾产品都依赖于问卷调查来判断用户的风险偏好和投资喜好，除去监管要求的考虑之外，问卷调查其实很难了解客户资产、风险偏好等的真实情况。因此需要基于用户画像和标签，来深入了解客户。所谓“用户画像”，即客户信息标签化，用一串描述性的标签来对客户进行分类和描述即为用户画像的典型案例。比如：男，31岁，已婚，收入1万元以上，爱美食，团购达人，喜欢红酒。与传统问卷不同的是，用户画像技术利用计算机的运算能力，为标签分析提供了一种便捷的方式，使得分析者能够程序化处理与人相关的信息，甚至通过算法、模型来“理解”人。当投资顾问具备这样的能力后，就能进一步提高信息获取的效率，为数据分析和组合推荐打下基础。

此外，移动终端设备是海量信息的汇集地，将金融、社交、出行、饮食等方面的数据汇聚成一个了储量丰富、增量巨大的数据金矿。在获得客户授权的条件下，利用种种第三方数据就有助于了解用户的各种消费需求及其理财能力。除了静态数据，用户线上的行为数据也极具价值，特定用户在什么时间、地点、做了什么事（浏览或购买某理财产品）都暗示着该客户的风险偏好和投资习惯。

随着自然语言处理技术的日益发展，人机对话也开始成为可能，人们已经通过计算机高效地处理客户的文字甚至语音输入。在投资顾问领域，自然语言处理技术将赋予智能投顾与客户交流的能力，投顾AI可以通过和客户的对话采集客户的流动性需求甚至一些个性化需求。

智能投顾的核心是投资组合的建立，重点有以下几个功能：

宏观模型为投资组合奠定基石：对宏观经济走势、政策的判断很大程度上决定着投资收益。一个优秀的智能投顾需要具备自动收集宏观数据，合理判断经济周期，有效解读货币及财政政策的能力。通过接入国家统计局、世界银行、IMF等数据源，智能投顾很容易实现对宏观数据的实时更新；通过一些分类模型，智能投顾也能对经济走势（上行、下行）进行判断。一个好的宏观模型对资产定价提供了标准，为决策制定提供了指导。

财务模型为投资组合提供个股分析：财务报表是分析预测一个公司表现的最好数据。具有财报解读能力的智能投顾能审慎分析公司的资产负债表、现金流表、利润表和权益变动表；对未来现金流、股息进行合理预测；通过戈登股利增长等模型对公司价格进行判断；通过市盈率、企业价值倍数等比率对公司表现进行评估。

组合模型为投资组合建议合理配置：智能投顾采用以现代投资组合为代表的一系列投资组合理论，对资产进行有效配置。其核心为有效分散风险，通过不同资产配置，尽可能地消除个股风险。优秀的个股选择和合理的资产配置共同构成了合理的投资组合。

择时策略为投资组合如虎添翼：择时策略使智能投顾具备事件分析的能力。智能投顾利用其强大的数据收集能力，通过支持向量机等模型对事件性质进行判断，能有效分析个股走向及市场情绪，及时止损或赚取超额收益。

客户购买投资组合后，智能投顾需要对组合进行监控。实时监控需要通过不断的自学习和分析模块，提供择时、择机的预警和提醒。同时，在不过度打扰客户的情况下，如何能够最高效地保持投资收益和风险控制也是核心所在。人工智能能够通过不间断的高效学习，发掘客户的日常习惯、活动周期和忙闲分类等，针对不同客户提供最大限度的个性化监控。

结语

如果说IT基础设施建设是“互联网+”环境下赖以生存的重要基础，大数据、人工智能等新技术则是令新型智慧民营银行发展壮大、在同业中脱颖而出的差异化战略工具。大数据技术的出现使得人类拥有了对一些数量巨大、种类繁多、价值密度低的数据存取、检索、分类和统计的能力。以深度学习为核心的人工智能技术可以实现以较低的成本有效地了解其中蕴藏的巨大价值。一方面，人工智能领域的一些理论和比较实用的方法，能够显著和有效提升大数据的使用价值；另一方面，大数据技术的发展也在为人工智能提供用武之地的同时，唤醒人工智能巨大的潜力。

随着越来越多的人工智能产品应用在金融市场，监管趋势也将逐渐清晰，市场也将随之进一步规范。因此，不管是新兴民营银行还是传统金融机构在日新月异的时代谋求自身立足之地时，都要用好大数据和人工智能这两把利器，真正谋求适合自身发展模式的差异化之路。

来源: 孙中东上海华瑞银行副行长、金融科技创新联盟理事