首页 » 行业动态

【2018金融科技创新榜参评案例展示】浦发银行:智能语音交互项目

时间: 2018-11-26 11:33     浏览次数:54    来源:未知

以下为浦发银行参评案例展示:

 

 一、项目背景

  随着谷歌Alpha Go围棋大战的热潮,这个时代对于人工智能的探索已开启了全新的篇章。如何赋予机器智慧,如何进行深度学习,如何将人工智能应用于商业领域,真正服务用户,让用户感受到“好玩,好用,amazing!”都是需要各个领域不断探索的方向。在商业银行领域,手机银行渠道日益成为银行与客户接触的最高频、最重要渠道,结合目前最先进的生物特征识别和人工智能,充分利用手机渠道全方位服务客户势在必行。语音识别技术、语义理解技术、声纹识别技术经过多年的发展已经相对成熟,具有不易遗忘、防伪性能好、不易伪造或被盗、可随身“携带”和随时可快速使用等优点,已在各行各业得到了广泛的应用。

 

  作为以移动化和数字化为发展目标的商业银行,更需要利用自身强大的数据资源和技术支持,在人工智能领域获得创新突破,以巩固自身优势,更好的提供专业金融服务。浦发银行手机银行创新推出智能语音交互功能,通过使用语音、语义和声纹技术为用户提供了高安全性,便捷性,趣味性的移动渠道使用体验。

  二、项目概述

  1、业务规划概述

  在充分研究了市场上的智能语音应用场景之后,我行在移动端率先推出了智能语音交互产品,打破传统产品交互思维,将人工智能、语音+触摸式交互和金融交易进行了融合。该应用在会话的设计上独树一帜,解决了目前银行业电子渠道业务流程的多项痛点,带给用户一种全新的,高效的交易体验。

  1)从“有边界”到“无边界”的交互设计,解决“找不到”、“难操作”的问题

  传统移动端会在固定像素界面展示内容,规范用户可以进行的操作,并根据固定的用户反馈设计交互场景。这就造成了多数用户反馈的,内容和界面太多太杂,找不到其所需要办理的业务;页面操作要素复杂,无从下手,常遇到各类不明确的报错信息导致难以操作等一系列问题。

  我行智能语音的交互设计有几个特色:无边界的操作模式、任务式的交互引导、高效的流程体验。无边界的操作模式是指将用户从手机屏幕中解放出来,不完全依赖于触摸式操作,而采用视觉、听觉和触觉结合的模式,可以用点+说+图片的多元形式,在短时间提高信息输入和输出的效率,用最便捷的模式完成整个交互。任务式的交互引导区别于市场上常见的闲聊式交互模式(如Siri,微软小冰,服务式机器人等),能更好的应用于商业银行领域,准确地了解各类客户意图,准确引导其下一步如何操作,以尽可能完成任务。高效的流程体验则遵循Grice表达准则,在交互的所有环节,都能引导用户陈述有效的与任务有关的信息、告知其录入简明准确信息量、双向沟通理解用户意图,及时剔除无关信息和异常情况,在最短的步骤内完成交互。

  例如,购买理财产品这项业务可分解为“为客户提供产品”-“客户选择产品”-“客户购买产品”三步。当唤醒语音功能时,在寒暄的同时,AI机器人也会唤起客户的理财意图——“Hi,我能为你做什么?您可以这么问,我想看看理财。”;当客户表达了理财意图之后,则会为其提供产品,并告知其如何高效的表达可快速完成选择并购买——“请告知我您选择的产品名称和购买金额。”;同时机器人会收集客户已有信息进行精准反馈,避免重复交互和录入——“请确认您的购买信息,直接展示客户签约卡号”或“很抱歉,您的风险评估已过期”等。遵循科学的框架设计,整个业务只需要三句简单的自然语言交互“给我推荐个理财”-“我要买某产品XX万元”—“确认购买”即可完成,同时用户的精力和双手都可以获得释放来做其他事。

  2)从精确化指令到自然语言的识别理解,解决“太专业”、“记不清”的问题

  在商业银行,专业的行业术语和复杂的产品名称一直是困扰客户的头疼之处,同样也是语音识别的难点。如一个客户想买货币基金,却要面对余额宝、朝朝盈、普发宝等各种名称,最后可能在对的地方说出了不对的名称,只能宣告放弃购买。同理,各家银行大同小异的菜单名称,过于丰富的产品系列均要求精准指令,反而对用户体验造成了大大小小的困扰。

  我行的语音交互产品为解决这一痛点,在语音识别和语义理解以及深度学习方面均进行了定制化设计。首先在语音识别方面,应用了科大讯飞的定制化的语音识别引擎,针对各类菜单名字、产品名称、交易术语甚至是客户姓名的识别进行了录入和训练。当客户说我要办理“结购汇”业务,可以快速定位到结购汇菜单,而不是展示“结构会”等无关词汇。其次是语义理解的泛话式拓展,即可以通过分析客户自然语言中所包含的意图进一步细化并定位业务场景。当客户说“我要办理黄金业务”,就存在购买实物金产品或进行线上金交所交易两种场景,通过语义分析即可进行双向会话,进一步确认客户需要办理的业务,并完成后续的交互,做到会话的灵活和可持续。由于语音输出是线性且无法预测的,因此针对语音交互框架的设定需要进行及时的调整和优化,通过标记输入的各类结果帮助智能引擎进行深度记忆和学习,持续提高输出结果的准确性。

  3)从六位密码到专属声纹模型,解决“双因子”“非本人”的问题。

  传统六位密码的认证方式总是以密码太多记不住,容易泄露非本人操作等问题饱受质疑,许多新型的身份认证方式如指纹、手势密码等也应运而生。为了进一步提高用户账户的安全性,很多业务模式也提出了双因子身份认证的要求,在用户体验和安全性方面始终难以两全。

  声纹认证的横空出世正有望解决这一问题。 在注册声纹认证时,用户就建立了个人专属的声纹模型。在使用时,用户只需要说出语音密码进行身份认证,系统会从语音密码的文字内容准确度和声纹模型的匹配度两个维度进行验证,保障双重安全。声纹模型也具备动态学习,自主调整的功能,可确保不同原因导致的声音细微变化不至于影响验证效果。声纹认证方式与语音交互的无边界交互模式相辅相成,密不可分,可实现无触碰、全语音人机交互的场景。

  2、系统概述

  浦发个人手机银行系统是我行零售板块电子渠道的重要部分,浦发手机银行客户端版涵盖iOS、Android系统的所有主流机型,版本兼容程度高。另有个人手机银行H5网页版,微信小程序等延伸产品,客户无需下载客户端软件,只需在手机浏览器中输入网址,或在微信关注公众号,即可体验线上业务。

  我行智能语音服务系业内首创,是智能语音语义分析在金融服务领域的重大突破。凭借AI领域强大的语音语义分析引擎,我行智能APP实现了人机语音交互办理业务。此外,智能语音服务还融入了贴近日常生活的寒暄话术、节日问候语和网络流行用语,让人机对话更丰富流畅,生动活泼。


图表:基于智能语音交互方式的手机智能语音银行系统的逻辑架构图

 

  3、项目实施重大事件表

  2017年8月中旬,项目任务书下达

  2017年9月下旬,业务需求规划完成

  2017年12月中旬,智能语音交互上线行内试运行

  2018年1月中旬,智能语音交互对客户上线,功能包含语音菜单导航和理财产品购买和寒暄话

  2018年2月,语音常见问答咨询上线

  2018年3月,语音查询类功能上线,包含语音账户查询、信用卡查询等

  2018年4月起,声纹随机数和文本模式上线试运行

  2018年5月,语音AR互动上线

  2018年7月,语音快速转账上线

  2018年8月,语音纪念日存单购买上线

  三、项目实现的主要目标

  手机银行的竞争日趋白热化,各家银行在易用性,交互方式和人工智能都不断发力。融合人工智能技术,将原先流程化的银行业务办理改造成快捷方便,有趣高效的过程。同时不断提升互联网时代的开发迭代能力,保持市场领先。

  1.打造一流用户体验,降低用户操作门槛。通过使用人脸识别技术,将手机银行登入操作简化,无需输入密码,扫脸即可登入,在转账和签订贷款时通过扫脸降低了欺诈风险,保证用户资金安全。声纹识别语音识别结合打造出一个完全不需要双手操作的语音银行,用户通过声音与手机银行进行交互,并在关键交易节点通过声纹进行验证,完成交易。整个交互过程简单有趣,快捷流畅。语音银行结合客服知识库之后还能和用户进行日常对话,闲谈聊天或者解决实际问题。

  2.紧跟先进技术发展,强化手机银行安全机制。计算机技术发展日新月异,众多生物特征技术孕育而生并投入在实际生产环境中使用。我行手机银行紧跟时代步伐,积极研究探索新技术在金融行业的应用。在登录环节,业务关键节点引入了最先进的语音语义和声纹识别技术,强化手机银行安全机制,确保客户资金安全。在业务流程改造方面,完全摒弃了界面改良的方法,引入目前最先进的人工智能技术,打造一个全新的语音智能助理。在同业中,智能语音银行的推出我行尚属首家,是一次重大的业务和技术突破。

  3.实行敏捷迭代开发,快速响应市场需求。互联网时代,市场无时无刻不在变化,作为直接面对客户的手机银行只有拥抱变化才能长久立于不败之地。同业手机银行竞争激烈,考虑到市场需求迫切,我行组建专门项目组,打破业务和科技的壁垒,采用敏捷迭代开发的方式,快速完成业务需求的开发,测试,投产过程。在极短的时间内完成了多次迭代上线,功能逐渐完善并得到市场的认可。

  四、项目小结和未来展望

  智能语音交互功能上线至今,已有159.93万人使用该功能,其中理财咨询和购买约11万人次,单笔平均交易金额为23.4万元,高于传统渠道的单笔交易金额。观察发现,其中不乏诸多百万以上的大额理财,可见移动端创新和极简的交互同样获得高端客户认同。

  除现有的技术外,该功能未来将搭建语音语义的深度自学习模型,进一步提升智能语音交互的智能化和灵活性。同时,我行也积极探索智能语音交互在电话银行、自助设备、智能手表或智能音箱等各种设备上的应用加载,在多渠道都覆盖各类常见的金融功能,让人工智能的发展成果为用户提供更加便捷的服务。

  更高效率、更加自然、更加接近于人本能的交互方式必然是未来趋势,而语音交互在特定场景中的适用性一定会在未来的人机交互方式中占有重要地位。商业银行恰好可以顺应这种场景的延伸,通过声音的传播,将金融和相关衍生性服务拓展到用户生活的各个方面。