数字经济的发展为金融业注入了充沛的活力,也为市场化个人征信行业的发展带来了机遇。《金融科技发展规划(2022-2025年)》强调充分释放数据要素潜能,强化数据能力建设,建立涵盖数据全生命周期的数据治理体系。在数据要素市场持续健康发展过程中,加强征信数据治理,提高数据质量,促进数据融合,保障数据安全合规,从而挖掘数据价值,全面提升征信机构的数据服务能力,已经成为市场化个人征信机构的“芯片级”的核心竞争力。

市场化征信机构数据治理包括“一个聚焦三个全面”。“一聚焦”指聚焦于征信机构对外服务的数据治理,即市场化个人征信机构从外部金融机构、互联网平台采集信用数据,经过整理加工,再重新服务于金融机构、互联网平台的过程。不包括针对目前谈论很多的内部管理运营方面的数字化转型等。当然,市场化个人征信机构自身提高数字化建设水平,利用体系内数据,增强运营效率和决策能力,配合外部合作机构,共同打造开放式的征信平台,也是我们关注的命题。“三个全面”包括全流程、全业务和全体系。“全流程”指数据治理涵盖征信机构对外部数据进行采集、整理、保存、加工,以及数据挖掘、对外服务等数据全流程。“全业务”指征信机构数据治理的重点不仅包括元数据、主数据、数据标准等传统内容,还应延伸至数据合规、数据安全、数据生命周期管理,以及异议处理等相关工作。“全体系”指数据治理本身具有较强的体系化特点,既包括核心的数据资产管理平台的建设,也包括数据治理的战略规划、人员等制度保障等多个层面。

百行征信有限公司研究部总经理 田昆

一、深化数据治理是发展的必经路

现阶段,市场化个人征信机构开展数据治理工作具有较强的紧迫性和必要性。具体体现为如下三个方面。

1.征信数据的质量提升需要数据治理

数据质量问题贯穿整个“数据供应链”,是征信服务基础。《个人信息保护法》要求,处理个人信息应当保证个人信息的质量,避免因个人信息不准确、不完整对个人权益造成不利影响。市场化个人征信机构想要实现征信数据的准确、有效与易用,产出高质量的分析成果,首先需要保障源头的数据质量,防止出现数据“garbage in”“garbageout”的情况。从数据采集端来看,市场化个人征信机构与银行、助贷、小贷等各类主体广泛开展信贷数据共享合作,数据来源渠道众多,共享的方式多样,不同机构的数据治理水平层次不齐,在缺乏强制性手段的情况下,采集端信贷数据质量难以保证。另一方面,支付等各类替代数据也是市场化个人征信机构重要数据采集来源,但替代数据标准建设尚不完善,机构间没有形成对数据项的统一认识,替代数据共享容易产生数据结构、定义不一致的典型问题。提升数据质量是市场化个人征信机构开展数据治理的直接目标,需要完善数据治理机制,建立覆盖数据全生命周期的数据质量评估、优化及监测体系,丰富校验规则,灵活应用自动化工具。重点从完整性、准确性、一致性、唯一性、有效性五个维度提升征信数据的质量。

2.数据安全合规需要数据治理

征信作为具有公信力的基础设施,肩负着维护信息主体合法权益,防止个人信息泄露和滥用的职责,需要遵守更为严格的安全和合规要求。合规方面,《个人信息保护法》要求,个人信息处理应当落实“告知—同意”规则,并按照“最小必要”原则采集个人信息,严格限制对敏感个人信息的处理。《征信业管理条例》赋予了信息主体多种权利,包括信息主体了解征信系统处理的关于消费者个人的信用信息内容的知情权,针对错误信息进行修改的异议权,以及删除超出一定期限的不良信息的被遗忘权。市场化个人征信机构要保障上述权利的实现,在保证数据质量的基础上,还需要做到对数据库内数据的精细化、可视化、实时化管理,这也离不开数据治理制度与系统的支撑。安全方面,市场化个人征信机构保存大量个人敏感信息,在事前事中事后均需要加强数据安全治理。按照《数据安全法》要求,明确数据安全负责人和管理机构,建立定期的数据风险评估与监测制度;建立健全态势感知、监测预警、安全防护、应急响应、恢复等数据运行能力保障,从访问控制、身份认证、数据加密、数据防泄密、备份审计等角度实现“进不来”“改不了”“看不懂”“拿不走”“走不脱”的数据安全保护目标。

3.数据融合应用需要数据治理

个人征信的市场化发展推动了征信数据来源、采集方式的迅速丰富,也产生了各种征信数据之间融合应用的需求。在推动信贷数据共享合作过程中,市场化个人征信机构对信贷、助贷、担保等的不同机构适用不同形式的接口,对于相同类型的机构可能也会采用“一行一策”,满足金融机构的个性化诉求,包括对具体数据标签项的增改,也包括针对少数标签的“轻采集”方式,以及“二代征信”报文直接转化的方式。相关数据均最终在同一份信用报告中展现,数据融合的复杂性可见一斑。此外,市场化个人征信机构正积极推动替代数据的应用,如支付、运营商、电商等。征信机构一方面要考虑来源特点,发挥同类型数据的融合互补作用;另一方面要结合信贷数据和其他替代数据,共同融合开发成征信产品。这其中千头万绪都要求市场化个人征信机构梳理盘点数据资产,开发统一的管理平台,并持续深入至数据治理工作中。

二、百行征信数据治理的实践探索

根据业务发展需要,百行征信成立数据治理与标准工作组,从战略规划、组织制度、系统建设三个层面持续深化数据治理工作,制定数据能力建设指引,广泛开展内外部调研,积极推进数据资产管理平台建设,形成元数据、数据安全与合规等一整套制度规范,构建完整、有效的覆盖数据全生命周期的管理体系,推动数据能力全方位提高。

1.战略规划:扬帆远航的“指南针”

加快制定公司层级的数据治理战略规划。数据治理是涉及公司多方位的体系化改造,要求各业务线、前中后台之间的有效协调,也需要结合公司技术系统建设水平、数据资源以及业务应用的开展现状进行综合考虑。应当从管理层、领导层出发,从上向下全局部署数据治理方向,从而形成全面的标准规则体系和执行调度流程。战略规划是数据治理成为企业战略核心任务应用的重要部分,是数据资产得到一定程度内外部应用的指导蓝图。

具体执上,首先结合市场化征信业务特点,制定征信领域《数据能力建设参考意见》,明确数据治理工作的总体目标,以及数据质量、合规等细分方向的要求。在此基础上,可进一步开展内外部调研工作,重点对一线员工进行访谈,总结归纳内部存在的问题及外部建议,形成《调研报告》。调研应当覆盖数据采集、数据运营、元数据、数据挖掘、数据安全合规等主要业务流程。结合公司资源禀赋与业务发展战略,制定《实施路径建议》,划分工作层次,明确责任部门、资源投入与周期,分别确定数据治理推进路径。总体上可按照“打基础、建系统、定制度”的三步走路径(见图1所示)。

图1 市场化征信机构数据治理总体框架

2.系统建设:协同前行的“划船桨”

系统建设是数据治理战略落地的主要载体,也是数据管理活动的实操平台,需要市场化征信机构尽快整合技术资源,搭建统一的数据资产管理平台(见图2所示),具体包括元数据管理、主数据管理、数据标准管理、数据质量管理、数据应用管理、数据安全管理、数据合规管理七个方面的职能模块。

图2 市场化征信机构数据资产管理平台

市场化征信机构数据治理的基础系统工作是元数据管理。元数据是数据的数据,是对数据的结构化描述,使得数据更容易理解、查找、管理和使用。元数据主要包括业务元数据和技术元数据两类。业务元数据可以消除了数据二义性,尤其是相似信贷数据之间的混淆,让业务人员对数据有一致的认识,避免“各说自话”,进而为数据分析和应用提供支撑。技术元数据通过理清数据关系,明确存储、机构,让业务人员快速定位所需的数据,实现数据血缘追溯和影响分析,为产品开发和系统集成服务。元数据构成了征信数据从采集、加工再到延伸拓展的关键节点,应当作为市场化个人征信机构开展数据治理工作的起点。搭建元数据管理系统,配合相应管理办法及技术规范,梳理数据资产,建立元数据字典,并完善元数据采集、访问、管理、分析、开发支持等主要功能。

在元数据工作基础上,要继续实现数据标准管理和主数据管理的职能。数据标准能够统一数据定义、数据分类、记录格式和转换、编码等,实现数据的标准化。包括采集标准、数据存储、标签命名、衍生等一系列标准和原则等均需要在初期重点关注。数据标准管理包括标准制定、标准实施、标准评估等。市场化征信机构的主数据指个人、企业征信数据库中的信贷数据,此部分为征信业务所需要的关键资源,应尽快地建立技术、运营、产品共享的主数据库,可考虑建设单独的主数据库。针对市场化征信机构使用频繁的替代数据亦可纳入主数据的管理范畴。

在上述的架构、标准、规范工作基础上,可以进一步完善市场化征信机构数据质量管理,具体包括来自信息主体的数据准确性评价和来自产品开发部门的价值评价。市场化征信机构可建立起数据质量需求、数据质量检查、数据质量分析、数据质量提升在内的一整套自动化系统方案,对采集、使用过程中的数据进行持续的格式、逻辑校验与分析,确保数据的完整性、准确性、一致性、及时性,提升数据应用效果的稳定性。数据质量是数据应用分析的保障,在高质量的数据管理的支持下,可以实现数据挖掘、数据应用等主要功能。

此过程中,数据安全管理、数据合规管理将贯穿数据治理与标准工作始终。其中数据安全包括数据安全策略、数据安全管理、数据安全审计,可以借助纵深防御体系等成熟的技术防护架构,建立多重安全防护架构,确保核心数据防泄漏,并加强数据使用行为监控审计,可以运用安全态势感知、大数据分析技术,主动发现和追溯数据泄露,及时采取有效控制措施。数据合规包括数据采集规则、数据授权、授权核查管理、异议处理更正、征信数据过期销毁等环节,可考虑尝试通过区块链及零知识证明等技术持续完善征信机构个人信息授权核查机制。相关工作为各项管理职能落地和统筹提供了有力支撑。

3.制度保障:行稳致远的“压舱石”

为了保障数据治理工作的有序开展和长效落地,市场化征信机构还应设计一套有针对性的数据资产的管理流程、管理机制和考核评估办法,通过管理的手段明确各方“责权利”。并建立一套覆盖数据共享、处理、应用等覆盖数据生命周期的管理办法,从制度层面保障数据治理工作规范有序、长期运转。具体包括但不限于元数据管理办法、数据标准管理办法、数据质量管理办法、数据安全管理办法等对应具体管理模块的规范。

同时,管理办法还需配套相应的技术规范文件,明确实操的技术细节,为办法落地提供基础,避免笼统性、概括性表述。以元数据管理为例,可包括元数据的获取、命名规则、数据模型、注册分类、日常维护、落地应用等一系列流程,并考虑指定相应的牵头部门进行管理。制度执行的过程中需要进行事中监控与事后考核,确保制度落实到位。事中监控包括对项目的评审,以及数据运营情况的动态监测;事后则需建立考核指标,真正将数据治理纳入部门日常工作职责中来。

此外,针对公司整体的数据治理情况,可设置数据审计机制,从而综合地评估公司数据治理水平,明确下一阶段工作方向。审计内容既包括对数据资源安全性、准确性、完整性、规范性、一致性、唯一性和时效性的基础评估,也应包括数据治理战略规划、制度规范等的执行落实情况。审计过程中可考虑信息技术审计及监管科技的应用。加强培训宣传。培训宣传是实施数据治理的重要组成部分,公司内有序的协调需要公司上下较为一致的思想与意识。企业开展数据治理的培训教育周期、培训内容和参与方式,包括:数据治理体系培训,行业内、外部单位优秀经验沟通与交流等。

三、培育数据治理的核心竞争优势

1.构建开放化中台,推动打造征信生态

数据资产管理平台是数据治理的核心平台,在此基础上,市场化征信机构还应进一步完善平台功能,打造一站式的数据中台,为开放的征信生态建设夯实系统建设基础。一方面需要通过前期的业务积累和金融科技公司的支持,沉淀形成众多易用的数据应用工具及分析成果,形成金融机构自主化、定制化的建模风控平台;另一方面,也需要完善数据产品服务能力,构建模块化的产品开发模式与敏捷开发能力,支撑征信生态的高效运转。技术实现上,数据中台可运用Hadoop技术栈、New SQL技术栈和图数据库技术栈等,结合数据仓库、元数据、数据沙箱等技术,采用批流结合的数据处理模式,构建产品迭代的高速流水线,数据存储能力达PB级别,日数据加工能力达TB级别,数据服务TPS达数万级别,降低数据资产管理成本。在实现数据资产精细、动态、系统化管理的基础上,数据中台将成为连接合作伙伴的纽带、促进行业发展的抓手,在安全合规、自主可控的前提下,实现数据智能驱动,成为数据共享、行业应用的孵化器,以及打通信息流、商务流、资金流的价值中枢,全面提升数据能力、产品能力、技术能力和整体对外服务能力,在业务平台化的基础上,实现产业生态化,构建专业开放、协作共享和高科技赋能的征信生态圈和产业链。

2.开展征信标准建设,促进数据互联互通

2021年新出台的《征信业务管理办法》将替代数据明确纳入信用信息的范畴。原有征信替代数据市场将会发生洗牌,在行业整改规范过程中,替代数据源的采集应用的规则、范式都需要通过持牌的征信机构重新进行明确。市场化征信机构可结合市场应用情况,针对支付、运营商、设备等各类替代数据,积极开展数据标准建设,覆盖数据处理业务流程。采集端,配合相关平台方,加强数据采集管理,严格落实《个人信息保护法》“最小必要”原则,通过数据采集端标准化,有效保障替代数据质量,促进不同机构之间数据融合共享,推动采集方对采集信息的客观公正展示,保障用户知情权;应用端,强化评分产品可解释性,避免算法歧视,解决非授权、非公允的大数据征信问题,落实金融科技创新的伦理要求。此外,市场化个人征信机构可积极完善信贷数据标准,推动建立与公共征信机构之间的数据共享机制,并探索与境外征信机构的征信标准互认,推动跨境征信的发展。

数据是新时代重要的生产要素,是国家基础性战略资源,而数据治理则是实现激活数据要素潜能,实现数据要素有序流转、应用的“钥匙”。中国市场化个人征信机构作为数据要素应用的行业探路人,需要不断强化数据治理能力,打造核心竞争力,真正发挥征信作为金融基础设施的公信力,提升服务意识与服务效率。