金融科技创新联盟

首页 » 行业声音

人工智能 | 微软张祺：人工智能发展趋势暨行业创新

时间： 2019-05-14 14:18 浏览次数：88 来源：未知

近日，由金融科技创新联盟和上海浦东发展银行联合主办的“智见未来·2019智能金融高峰论坛”于上海成功举行。微软（亚洲）互联网工程院常务副院长、人工智能核心及商用部总经理张祺从人工智能的“三大基础”、数据安全以及平台应用等方面做了主题报告，并结合人工智能技术在微软的发展案例进行了经验分享。

金融科技创新联盟副理事长

微软（亚洲）互联网工程院常务副院长

人工智能核心及商用部总经理张祺

以下为现场发言实录：

尊敬的各位来宾，大家下午好！

刚才听到了潘行长，潘院士还有陈司长的精彩分享，再一次深切体会到了咱们国家在发展人工智能，促进金融产业创新方面的决心、动力和前瞻性的布局。微软作为一家人工智能的平台公司和云服务的平台公司，我们也非常希望能够在这样的合作过程中，为金融企业创新提供更好的赋能作用。

这个视频是我和我的团队在10多年前在手写数字识别领域的深度学习应用模型。我从1999年开始做人工智能和机器学习的研究，到今天刚好20年。我们在2008年做了一款5层的深度学习神经网络。当时用了GPU加速神经网络的训练，在研发和产品开发过程中起到了非常决定性的作用。而现在深度学习已经发展到几百层，回头看有几个比较深刻的体会.。第一个是科技创新到应用的确需要长时间的积累，很多事情现在能产生这么惊人的效果，都要归功于十年或者二十年之前所做的积累。

第二是颠覆性的创新是不可避免的。当时有很多非常资深的研发人员，大概工作了十几年基于CPU做模型训练的优化，实际上当GPU训练引入以后突然之间就把所有的规则都改变了。

第三是行业的选择很重要。我当时从OCR识别开始，技术做得非常好。但是你会发现真正的商业应用价值没那么高。在现在的数字化转型过程中, 我们同样要思考一个问题，同样的技术、同样的人才到底投入在哪里才能获得最大的经济效益。

人工智能的三大基础，在座的各位我相信都有非常深刻的了解。第一要有大数据，第二要有很强的计算能力，第三算法要创新。

从微软的角度去思考，我们其实有另外一个很强的维度在数据方面。刚才几位嘉宾都提到，数据本身的安全性思考、用户隐私思考是在人工智能方面非常重要的维度。

微软在企业应用方面拥有丰富的技术和经验积累，我们本身数据安全的保护标准非常高，这个非常重要，在大数据应用方面需要深刻的思考。

在这个维度上还有一个很有趣的模式。你会发现在公有云、私有云、混合云的构建过程中，什么样的计算在云上发生，什么样的计算在端上发生，所有的方方面面都非常重要，因为整个应用场景非常丰富，如果只具备一种形式很可能是不够的。我相信在各个行业里，尤其在金融业数据强监管的环境下，如何把计算能力的部署更好的全方位地实践，这是一个非常值得思考的问题。

第三类是算法的提高。这方面微软也是布局很早。早在1991年，比尔·盖茨先生就提出创造能看、能听、能读懂、能交互的计算机。我们当时就在语音识别、语义理解和计算机视觉三方面投入。我很自豪的说，微软在世界范围各个人工智能领域都率先突破达到了媲美人类的水平。我们在2016年创造的深度神经残差网络达到了图像识别96%的识别精确度，在2017年达到了95%的语音识别准确率，在自然语言理解方面，我们也达到了非常革新的成果。然后是机器翻译，最近通过神经网络的语音合成技术，我们达到了可以跟真人效果比拟的逼真度。

最新的技术突破不仅在于准确度，更大的亮点是需要的训练时间非常短。大概只需要十几个小时的录音语料就可以实现非常精准的语言合成。几个小时的数据就可以让它的讲述和真人讲述很像。我们在内部开员工大会时，有些场合就可以把脚本提前准备好, 然后通过语音合成完成演讲。这样的方式可能会少了一些人和人交互的亲切感。但另一方面是不会出错，而且也不会超时，这种体验和传统的交互模式给人的感觉是非常不一样的。

在基于算法不断优化的基础上，我们在商业市场之上的应用，主要体现在开发者的群体或者社区里的使用。比如我们的认知服务就拥有众多的开发者使用。其中，我们的对话机器人服务、语言翻译等的市场渗透率非常高。

微软是一家平台型公司。强调的是在发展平台能力和智能构建的能力。今天的分享主要是想阐述微软自身对于人工智能的使用和思考，如何更好地赋能我们的合作伙伴。

微软的人工智能技术第一部分是做基础研究，做了非常多的投入，率先达到了与人类相媲美的水平。我们不断地把它部署在微软的各领域内，以更好地服务用户和产品与企业。

下面是就技术创新在微软办公企业Office的应用跟大家来做一个分享。当图像识别达到很高的水准以后，我们很快的把这些能力放到ppt自动设计功能里，这样就可以通过图片识别，更智能的建议你需要什么样的模板和构建。

语音水平达到人类水平以后，我们迅速把它放到同传的功能里。你安装了这个插件以后，只要下载一个很简单的客户端就可以使用这个功能。

当机器阅读技术达到更高的水平以后，我们的微软搜索服务就变的非常的发达。这不但包括互联网搜索，还包含了文档的搜索，甚至在操作系统里整个泛平台的搜索功能。

机器翻译在同传里可以做语音识别和翻译。另外它本身单独做了非常强大的英文翻译功能，在Office365也得到了很好的应用。

因为Office在全球范围里的用户众多，它带来的数据的数量级也非常大。整个过程是闭环增长的过程，因为这些智能功能的进步，带来了更多用户使用习惯的变化。因为平台产品具备这样的用户量级，更多的人去使用以后，就会产生更多的数据，这些数据反馈回来就会产生价值。大家在做人工智能产业升级方面，都要很好地去思考这些维度。强者会愈强。

微软公司整体有一个非常广泛的数据构成。在企业应用和合作之间会非常重要。世界知识上，可以在网上查到。这么大的图谱构建本身带来了非常大的规模技术化难题；另外我们对于个体了解的个体知识，包括消费者端，还有包括企业用户端；这两者中间还有个非常重要的组织知识。这三方面怎么样更好地协调起来？基于这样的知识图谱在后面有什么样的服务？刚刚也有提到在金融方面的风险规避，每个月要处理4700亿的电子文档和电子文件，每个月会有4200亿次的Office办公文件里的交互等等数据。这样的规模带来的产品要求、技术要求等等能力都可以用不同的方式输出给我们的合作伙伴。

下面我把智能安全图谱和金融行业本身对于安全的需求跟大家做一个介绍。

整体200多个微软产品和服务的面非常广，两百多个覆盖全球云上，还有在用户端，还有在商业服务端。这么大的用户产生以后，导致了我们每天会收到6.5TB的威胁信号。在这之上，我们的搜索引擎每个月都会扫描180亿的网页。

在这么大规模的用户层面上, 脚本怎么使用？钓鱼网钓鱼的脚本怎么使用？所有的信息汇总起来，微软本身在企业端，在用户端，和总共6300亿的微软账户交互过程中的巨大数据量。所有的数据结合在一起构成了一张万亿级的智能安全图谱。

在500强的企业里，90%的都在使用微软的安全服务。这项服务的构建，正是基于这样的大数据以及后面的智能图谱研究。

其他AI应用方面，互联网广告领域大家也应该并不陌生。我觉得有一点可以跟大家分享，大家如果真的想去构建自己的团队，需要招人的时候，我的建议是去考虑做互联网广告的人才。他们能更好地在这个行业里发挥作用。好的技术应用带来的是百万级、千万级的收入区别，而且他们在数字化实验交互、上线等方面都有很强的经验。

我们在搜索引擎和互联网广告领域覆盖了4.7亿的用户。每年收入已经接近100亿元，同时还有40万广告商用户。

人工智能商业效益最高的产业应用应该还是互联网广告行业。

这是效果上的衡量，因为本身的数据之大，它对于速度和模型构建有非常强的要求。互联网公司包括微软的必应搜索都有非常强大的训练系统。从第一代的2亿参数进化到第五代支持一千亿的参数也就是短短几年的时间。这对于本身模型精度的提高，可能带来的业务增长是什么样的效果？当我们把人工智能技术赋能到行业里，这些规划方向需要大家好好考虑。

在微软内部我们把所有的产品数据都汇总起来。我们一天要处理10个PB的数据，而且需要做到毫秒之内的在线反应。

在拥有了这样的核心技术能力后，我们要把AI能力运用到微软产品之上的时候，我们就要考虑负责任的、值得信任的科技之心在哪里。这两个维度在我们把产品和服务赋能给第三方的时候就显得更加的重要。

刚才讲到了人工智能本身的发展和这些技术、产品构建在微软内部的发展，接下来我想简单跟大家分享一下我们怎么把这些能力通过云平台的方式更好地分享给我们的合作伙伴和我们的企业用户。首先要提到的是微软认知服务。在这些通用认知服务的基础上，加入客户的数据就可以进行定制化。

从最底层的部署到技术运算的支持，到AI的训练与开发，还有框架的支持，最上层的就是认知服务的支持。

这里面还有另外一个问题，人工智能真正落地的时候，其实还是很有挑战的。它最大的问题就是定制化赋能。在传统IT软件服务的部署之中，我们有一个理念叫最后一公里。在人工智能的构成里有两个问题，第一个问题有最后一百公里的过程，还有一个问题最后一万公里的过程。大家可以比较形象地感受一下这个区别。最后一百公里人工智能的使用要跟行业的场景、行业的数据深度结合，在这个过程中，并不是很简单的一个产品发布就可以。实际过程需要很长。

人工智能公司和平台要和行业本身的数据有很好的沟通过程才可以达到预期的目标。一定要想怎么样更好的用反馈数据去改变、改进模型的精度。从而把利益和价值最大化。微软是一个平台公司。为了更好地赋能行业，为了更好的把AI与行业结合起来，我们成立了一个创新团队。我们内部叫行业+AI，这和刚才潘院士分享的数字产品化，产业数字化很相似。85%的构成是产业数字化。AI对于行业变革非常重要。我们希望通过这样的方式，能够更好地把微软的人工智能赋能给企业的用户，在这个过程中滋生出生态系统。

人工智能从哪些维度帮助企业的数字化转型，怎么样更好地服务到你的用户，怎么样更好地创新你的产品，包括商业模式优化，怎么去优化企业内部的运营，同时怎么样更好地帮助到员工的成长，让效率变得更高？

在过去大概两到三年的时间里，我们在中国的市场做了很多的探索创新。我们大概接触了一百多个头部企业，最后精挑了二十多家企业做了非常深入的POC和DET的功能实施。解决方案的创新有八个维度可以思考一下，行业领域的选择、标杆客户的选取非常重要。同样的人工智能技术，如果用在OCR上，你可能只能解决一部分点的问题，但是如果把同样的技术用在广告业、金融业就可能产生非常大的改变效果，这是第一个维度需要思考的。

另外是价值的体现和衡量。使用了人工智能技术后，到底带来了什么样的效果。刚才提到了一百公里和一万公里，这点讲起来很容易，但是做起来很难。状况的语言都不太一样。变革会带来利益上的变化，因为可能会削减人力资源。在这个方面, 公司文化、公司的领导决策层支持等等都非常重要。上下游生态的构建、资本的建立是因为短时间内技术创新可能不赚钱，但是企业又不能无限投入，如何借助资本的力量，打出头部优质的场景、客户、产品非常重要。

即使像微软这样的公司，到最后要解决的也是规模化可持续发展的问题。

人工智能听起来非常好，它的潜力无限。但是真正意义上在产业的实施过程中，你会发现因为前期的投入太高，数据基础构建投入太高，本身训练的时长，包括对于资源的使用，包括人工智能人才的稀缺，方方面面加在一起，真正要变成一个产业的创新还有非常多的挑战。在这里面，我们怎么样结合这些思考，能够催生出一种规模化可持续发展的方式，真正意义上在各行各业能开花结果，这不光是我们作为一个平台公司，更重要的是需要各个行业的领军人物、领军企业去思考。

金融业三个阶段， 1.0是点到线的，2.0是线到面，3.0是面到体的过程。怎么样把这些结合起来就变得非常重要。有很多的合作伙伴和用户。在这个基础之上，更大的问题是我们在一起如何合作。

这一点我着重讲一点关于金融知识图谱的构建。我们最近跟好几个行业，包括跟保险行业构建保险知识图谱，跟电信行业构建电信服务知识图谱，还有跟汽车公司一起建设汽车行业知识图谱。

知识图谱概念是一个很重要的维度。如何把刚才提到的微软本身的知识图谱，微软图谱、安全图谱的大规模构建能力更好地赋能给金融行业，构建金融行业本身可以协调统筹安排的图谱类的服务是值得大家引起思考的。

最后大家需要思考技术如何真正规模化的历程。首先是研发，第二部分是产品化落地，第三部分商业化。但这些是不够的，更重要的一部分是，如果企业要做大做强，实际是平台化和生态化构建的过程。这一点上微软有得天独厚的优势，同时也有很多的经验。我们更希望微软作为一个平台型公司，能够可以和行业里的领军人物更好地合作，构建出属于这个行业的AI服务，通过这样的方式一起构建生态系统，合作共赢。非常期待与各位的合作。

谢谢大家！