张真 百信银行首席技术架构师&AI Lab负责人
目前负责基于自然语言的动态银行研究与落地,关注AI技术与金融,办公,生活场景的深度融入;开源软件UAVStack创始人,面向智能运维提供解决方案,AIOps专家;曾任宜信高级架构师&研发总监,负责金融架构演进与优化,智能运维体系建设,DevOps工具链等。曾任IBM资深架构师,负责应用服务器,语音识别,语音合成,机器翻译,IVR等产品的设计与开发;多个国际技术专利贡献者。
摘要:互联网银行是智慧金融发展中的新物种,不同于传统银行业的网点触客,一方面它更聚焦互联网,通过各种线上/线下的场景融入触达客户;另一方面业务不但要适配“快”的响应,面对强监管,内控更要守住“稳”的基线,面临新的挑战。智能应用不但可以很好的融入场景,并通过各种终端触客,还能实现增效降本避险的效果,因此如何深度运用智能化技术是突破这些挑战的关键。但对于新兴企业,新兴业务形态数据往往是制约其智能化的主要制约,而且业务场景越多这种制约就越发明显。
本次议题分享了“一种小数据驱动泛场景智能应用”的思路,同时通过对其在架构,关键技术,实践案例的探索的深度解读,来阐述其如何构建与落地。
机遇与挑战
百信银行是由中信银行和百度联合打造的创新型互联网银行,它完全构建在云上,即基于分布式架构,是一家AI驱动的数字普惠银行。以领先的数字科技能力,构建起以普惠金融和金融科技为核心的全新产品体系。技术人员占比超过60%。
传统金融是相对比较独立、隔离的。金融未来的趋势会慢慢的无感化。随着智能化的发展,包括5G、AI等新兴技术,我们看到以语音为代表的多模态交互方式,会成为一个新的入口。语音可能会是金融服务非常重要的客户触点。
百信银行作为AI驱动的数字普惠银行,通过开放银行模式连接场景生态,通过金融产品创新及科技能力,与合作伙伴共建场景化金融服务,解决流量导入、运营及变现等问题。自2017年成立至今,百信银行用户规模超过两千万,保持着较高的增速。
银行业数字化发展面临着严峻挑战,金融业务纷繁复杂,制度流程需要合规。我们聚焦在互联网,当互联网的流量过来后,客户的增长速度和业务迭代是非常快的,这就需要我们在快和稳之间找到平衡点。
我们希望把银行的金融能力,包括账户、资金、风控能力等,以智能应用的方式,融入到很多的场景(金融、生活、办公)里。我们会通过各种终端(智能音箱、电话、小程序、移动APP)触达客户,使用户更好的享受简单,可信赖的金融服务。
当然,如果想要构建这样一个场景,我们还会遇到很多困难和挑战,第一点可能是团队能力的制约;第二点是面向场景本身的高试配成本;第三点,在开发模式上,目前还不够敏捷;第四点,技术工具方面的制约。
泛场景智能应用体系
构建泛场景智能应用面临的问题有:
团队能力制约
AI是一个非常复杂的领域,包含自然语音处理、机器学习、语音识别、语音合成、无人车等,这些本身对于人才的能力要求非常高。在落地过程中,除了人工智能技术外,必须要结合应用场景,运用行业知识,完成IT工程的交付,这就要做到三元合一。
面向场景适配成本高
我们有很多场景,比如2B端、2C端场景。每个场景都不一样,里面涉及的定制工具包括算法,会有很多,最终都是通过各种终端触达到客户。而场景越多,终端越多,那么适配次数就在不断累积,因此适配成本会成随它们的数量而直线上升。
开发模式制约敏捷
我们的经验表明,一个可用的智能应用的交付需要经过16个步骤,这需要非常专业的算法+工程的投入,而且交付周期都是以月计。
技术工具制约交付
在人工智能领域,耳熟能详的工具是机器学习平台。但我们需要注意,机器学习平台主要提供算法、算力和服务,它并不是面向最终客户交付。同时,它的使用者是算法工程师,这也使得只有局部专业人员才能使用。
我们思考的破局之道,是要构建一个“AI应用加速落地”的能力,可把这种能力叫做“AI应用加速器”,包含三个特征:第一,要把AI门槛降下来,不能让它成为少部分人的奢侈品,理想是“人人都是智能应用设计师”;第二,希望它能够更加面向客户交付,而不仅仅是提供模型服务,毕竟后台服务到客户还有很远距离,必须把整个生产链条加速,才有可能真正实现敏捷。第三,一次开发多终端发布,目标就是要消除高额的场景+终端的适配成本。
在模型交付方面,机器学习平台可以做数据的导入、验证、训练,服务部署,但并没有解决算法模型选型的问题,尽管Auto Machine Learning有了一定的发展,但这部分工作主要还是由有经验算法工程师来完成。此外,往往模型训练也是面向每个需求的,很可能是从零开始,这样导致模型交付周期比较长。
敏捷模型交付强调模型的“泛化能力”,通过面向业务领域的基础模型来训练面向每个需求的业务模型。一方面对业务模型的训练是“小数据增量”的,使得交付周期大大缩短;另一方面这种训练只需掌握什么样的数据能够达到目标业务效果即可,而不需要了解模型的算法细节,这就降低了AI应用门槛。
真正面向用户端的交付,往往是多个模型组合的结果,需要覆盖从感知、认知到执行的端到端流程,这样的过程是期望构建“乐高式”的开发模式。我们考虑把各种模型组合封装成AI应用能力,它是最小可编排的AI模块。有了AI应用能力之后,再结合小数据增量训练,就能生成业务模型。业务模型加上对应的业务逻辑,就组成了AI应用技能。再由这些AI应用技能组合成面向场景的智能应用。由于有了清晰的构建体系,使得每个部分的调整成本都会最小化,效率最大化,而且可以根据业务快速改变。
解决适配成本,本质上要实现三化:终端对接平台化,形成统一的协议,安全,通信的适配层;交互适配模板化,针对不同交互形式提供模板化的交互支持;智能适配透明化,根据不同终端的特性,自动转换输出介质,例如无屏智能音箱,需将图表转换成自然语言,H5端需将文本数据转换成网页。
打造AI应用创作平台
AI应用创作平台的定位是“AI应用加速器”,设计理念是用户通过对话/视觉与类脑系统进行交互,类脑系统生成决策,并通过API或数据驱动金融系统向用户交付服务。同时,金融系统将各种结构化和非结构化的数据通过“微智能”(自动发现-自我维护-自动适应)的方式反馈到类脑系统,类脑系统通过不断学习,从而不断提升面向用户的个性化服务水平。我们把这样的架构称作Interactable Brain-Like Architecture,即“可交互类脑架构”,简称IBA。
AI应用创作平台就是基于IBA的AI应用加速器,是一个完整的一站式的智能应用制造与发布平台。目前AI应用创作平台沉淀了九大AI应用能力,包括与生物特征和银行综合性账户业务相关的能力,包括H5人脸+活体一体化解决方案,智能核身;语音交互相关的能力,包括对话式任务、智能问答、智能报表、智能辅助分析;机器阅读相关的能力,包括语义提取,语义分类,文本比对。目前已逐步覆盖十一类面向B端和C端的应用场景。
基于AI应用创作平台,智能应用的敏捷交付得以实施。平台自身解决了AI应用能力的构建和AI工程化的问题。而业务侧由2个新的角色构成:智能应用训练师,他无需懂算法,只需使用业务数据完成训练即获得业务模型;智能应用开发工程师,无需了解如何与算法模型对接,甚至无需使用例如Java之类的高级编程语言,通过脚本开发即可完成业务逻辑开发。最终通过“乐高式”的AI应用技能组装交付给最终用户。
与机器学习平台不同,AI应用创作平台面向每个开发者,而不仅是算法工程师,它的交付物是完整的,面向客户的智能应用,实现端到端的提效。
AI应用创作平台基于“AI应用加速器”的核心理念,打造四个核心技术:
● 强泛化能力的内置领域模型
● 小数据增量训练能力
● 一站式在线开发与发布
● 场景和终端自动化适配。
AI应用创作平台只需要3步即可完成,基本不需要懂算法甚至开发。
以网上银行业务为例,假如我们要做一个智能面签的场景,第一步,创建一个“AI App”即AI应用。第二步,创建一个智能面签的技能,但不需要关心诸如人脸识别,语音识别,语音合成,意图理解,OCR等复杂的模型,它们会被组装;这个技能可以被语音唤醒,而对这个唤醒的训练数据仅需10条就可以达到90%以上的高识别率;通过函数式计算脚本就能完成业务逻辑开发。第三步,只需点击几个按钮,就能轻松地将智能应用发布到各种终端,例如H5,手机App,智能音箱等,这个过程对开发者是完全透明的。
除网上银行业务外,目前AI应用创作平台已在很多领域交付智能应用。例如,在反欺诈领域,可以对百万级规模的交易风险进行智能判别,将事后判断提升为事中可阻断;在客诉领域,对全渠道客户输入进行智能投诉判别,同时对客服人员进行协同提示和预警,并对客户问题进行根因定位;业务人员可以通过语音交互的方式查看各种报表,智能分析可以帮助他们快速进行业务决策;在审计合规方面,智能审计通过机器阅读替代专家大幅提效,原来2小时的人工风险点提取,智能应用仅需5秒。
总结与展望
真正把整个智能应用快速地迭代和推动起来,还有很多工作要做。展望未来,有四个技术值得关注。第一,现如今多模态融合技术非常火热,大家看到的不仅是一个单纯意义上AI表现,而是语音、人脸,未来可能是一个综合性交互智能水平的体现。第二,小数据大任务技术的持续探索。金融领域有很多数据,但真正有意义的数据却是不均衡的,小数据训练必须要进入,否则会导致模型失真。第三,AI技能的智能编排,目前人工的方式在更加复杂的智能应用场景下将有很多局限性,智能编排可能更高效的适配业务需求。第四,通过微服务API智能调度,逐步消除人工编写API调用的工作,使得智能应用的构建更加高效。
最后,期望我们的经验能够对大家形成有益的参考,欢迎大家多多交流!