小微企业的信用数据来源主要包含几个部分:除了人行征信系统和银行内部自有数据以外,主要集中在政府部门或公共事业部门,其他同业金融机构,还有部分分散在供应链核心企业,以及互联网企业中的替代性数据,数据来源的分散化、碎片化使银行获取数据的成本高、难度大,加上整个社会信用信息体系尚未完全打通,信息获取的渠道不通畅,彼此之间仍然存在着组织壁垒、数据孤岛的问题。
另外,一些小微企业尤其是首贷户本身没有办理信贷业务的经验,不清楚银行贷款业务规定和普惠金融产品,不知道自己是否具备贷款资格,金融服务的需求端和供给端难以形成有效的沟通,造成了信息的双向不对称。
除了数据缺失外,数据的有效性也是当前面临的一个难点。由于替代性数据的信息采集、处理机制不同,来源又非常复杂,数据的准确性、真实性相对较低,银行出于合规考虑,对数据厂商的选择和合作也更加谨慎;供应链核心企业所掌握的上下游交易数据、产品数据等保密程度高,加上链条各环节数据口径不统一,数据质量难以保证,并且存在大量半结构化、非结构化的数据,造成银行实际可用的数据量和数据有效性不足,数据治理的难度大。相关的法律法规在要求保护数据安全的同时,也重视对数据的合规开发利用。政务数据和金融同业数据本身的质量高、有效性强,能够帮助银行全面了解小微企业信息,银政、银银合作布局普惠金融,可以形成政府、银行、担保、保险等多方数据安全共享的体系,共同解决小微企业贷款的数据难题。隐私计算“可用不可见”的优势是这个过程中实现数据脱敏、脱密的关键,可以从技术上保障数据流通的合规和安全,满足政府、同业、供应链核心企业等对数据保密性的要求。可以利用多方安全计算技术加强在信贷业务场景的应用,例如在小微企业信贷业务申请、客户评级、图像隐私保护、黑名单共享、贷款资金流向监测等关键环节,通过在各方部署隐私计算节点,共同完成任务调度。根据易观分析技术应用成熟度模型(AMC)的趋势判断,目前隐私计算技术处于探索期阶段,技术应用还未完全成熟,但随着概念验证和试点部署的结束,未来隐私计算落地案例将会迎来爆发式增长。多方数据的引入需要部署隐私计算平台,存在一定的技术难度和场景适应性的问题,需要在结合自身业务结构和IT架构的基础上进行充分评估。在加强数据采集的基础上,需要对数据质量、真实性和合规性做进一步判断和治理。数据治理的关键要素是建立全行统一的数据标准,构建企业级的数据能力中台,打造数据底座,在数据治理的基础上,推进模块的快速迭代和复用,基于大数据、人工智能技术形成全流程、全生命周期的数据治理方案,结合小微企业的信贷业务场景、合同文本、业务图像等非结构化数据,对原始数据进行解析,融合计算机视觉、NLP、知识图谱技术,通过内容管理进行非结构化数据处理,实现智能搜索、内容安全洞察、内容自动化管理,提升小微企业数据的可用性,盘活数据价值。(3)提升模型性能,在数据有限的情况下充分挖掘数据价值数据本身是个中性词,数据的价值只有与业务结合才能真正发挥作用。安全引入多方数据解决的是数据缺失的问题,如何用好现有数据则解决的是数据有效性的问题。在数据量有限的情况下,对数据的挖掘、模型的建设变得更加重要,另外线上信贷业务对于自动化、时效性的要求很高,更需要提升模型本身的能力去推动业务进展。一方面可以利用人工智能的深度学习与知识图谱技术,通过业务规则设置、模型设计去识别、融合、分析自有数据,深度挖掘产业链条上下游企业的关联关系,建立小微企业的关系视图,改变小微企业财务报表不规范、数据无法利用的困境;另一方面可以通过机器学习对历史数据做出洞察,分析哪些数据可以更加有效、精准地识别客户,哪些数据具有普遍性,哪些数据只针对特定客群有应用价值,从数据中推导模式来指引信用模型或业务策略的改善。在普惠金融业务场景的拓展上,将隐私计算技术与大数据、云计算、人工智能、区块链、物联网等技术融合使用,发挥各自的技术优势,保证数据在进行联合计算的过程中做到风险的精准识别、安全的云端存储和数据流通过程可追溯的要求,丰富数据维度,实现数据的所有权和数据使用权相互分离,解决银企间信息不对称的问题,助力普惠金融规模扩大与高质量协同发展。