源点注:本文选自《征信》2019年第12期,作者张晶、李育冬。
张晶:讲师、教授,北京特华博士后科研工作站在研,主要研究方向为大数据征信、营销决策;
李育冬:教授,主要研究方向为商务经济学、理论经济学。
摘要:百行征信与央行征信中心形成“错位发展、功能互补”的市场格局,体现了 “政府+市场”双轮驱动的征信体系。
从百行征信的市场环境、行业格局、产业链结构、核心竞争力、面临挑战等方面,对百行征信的现状及市场化发展进行较为全面的分析与展望,能为方兴未艾的市场化个人征信研究提供有益的参考。
关键词:个人征信;征信市场化;风险管理;大数据;个人信息保护
一、我国个人征信所处的市场环境
随着改革开放的不断推进,近年来我国社会信 用体系建设取得了突出的成就,已建成全球规模最大的征信系统,成为我国重要的金融基础设施。
截至2019年4月,央行个人征信系统已收录9.9亿自然人的信用信息,个人信用报告成为反映个人信用行为的“经济身份证”,年度查询量达17.6亿次。
央行在发挥政府主导力量的同时,也非常重视征信市场的作用。2018年5月,在央行监管和指导下,由中国互联网金融协会与8家民营机构共同发起组建 的市场化个人征信机构——百行征信有限公司正式挂牌成立,标志着我国个人征信进入新时代。
央行征信系统是银行等传统金融机构进行风控 审核时的直接参考对象,它主要考察拥有银行信贷账户且信贷记录活跃的人群,在人口覆盖上存在一定的局限性。
互联网和大数据技术的广泛应用使得海量用户数据在互联网平台上快速累积,存在大量可用来判断个人信用状况的替代数据,其中互联网金融数据更是与信用状况存在强相关性。
随着我国互联网金融、消费金融和共享经济的蓬勃发展,市场化个人征信机构面临着急剧膨胀的市场需求,互联网和个人征信的有机结合是实现普惠金融的必然选择,而百行征信的正式营业意味着行业将在规范中迎来下一波增长。
个人征信是支撑互联网金融健康发展所必备的 基础设施。2019年9月2日,互联网金融风险专项整治工作领导小组、网贷风险专项整治工作领导小组联合发布《关于加强P2P网贷领域征信体系建设的通知》,支持在营P2P网贷机构接入征信系统。
互联网金融从业机构为了对用户的消费习惯、风险偏好和信用状况进行全方位了解,产生了大量身份识别、信用评估、用户画像、反欺诈等多方面的信用服务需求。
相对于传统征信,市场化个人征信可以覆盖更多的弱势群体,如广大农户、创业者、个体工商 户、大学生等,是互联网金融业务进行风险控制和产品定价的关键环节。
消费金融的快速崛起对个人征信的市场化发展
产生了巨大的推动作用。自2015年起我国互联网消费金融进入快速增长期,根据艾瑞咨询的统计数据,2017年交易规模达43847.3亿元,环比增长904.0%。
互联网消费金融体现了消费金融与大数据风控的深度融合,从而获取到传统消费金融所无法覆盖的长尾客户,促进了消费金融应用场景的拓展。市场化个人征信可以有效解决长尾客户的白户问题,形成新的消费能力,减少潜在的信用风险,降低消费信贷的交易成本。
共享经济的高速增长形成了对市场化个人征信 的新需求。根据国家信息中心发布的《中国共享经济发展年度报告(2019)》,2018年我国共享经济交易规模达29420亿元,环比增长41.6%。
共享经济是典型的信用经济,资源拥有者和资源使用者基于双方信任通过互联网平台完成交易,信用免押模式更是其主流趋势,因而共享经济平台的信用体系建设是其发展的要点。
市场化个人征信可有效解决共享经济中供需双方的信任问题,降低交易门槛,提升交易效率,使用户可以充分享受信息互通和资源共享带来的便利。
随着改革开放的不断推进,近年来我国社会信 用体系建设取得了突出的成就,已建成全球规模最大的征信系统,成为我国重要的金融基础设施。
截至2019年4月,央行个人征信系统已收录9.9亿自然人的信用信息,个人信用报告成为反映个人信用行为的“经济身份证”,年度查询量达17.6亿次。
央行在发挥政府主导力量的同时,也非常重视征信市场的作用。2018年5月,在央行监管和指导下,由中国互联网金融协会与8家民营机构共同发起组建 的市场化个人征信机构——百行征信有限公司正式挂牌成立,标志着我国个人征信进入新时代。
央行征信系统是银行等传统金融机构进行风控 审核时的直接参考对象,它主要考察拥有银行信贷账户且信贷记录活跃的人群,在人口覆盖上存在一定的局限性。
互联网和大数据技术的广泛应用使得海量用户数据在互联网平台上快速累积,存在大量可用来判断个人信用状况的替代数据,其中互联网金融数据更是与信用状况存在强相关性。
随着我国互联网金融、消费金融和共享经济的蓬勃发展,市场化个人征信机构面临着急剧膨胀的市场需求,互联网和个人征信的有机结合是实现普惠金融的必然选择,而百行征信的正式营业意味着行业将在规范中迎来下一波增长。
个人征信是支撑互联网金融健康发展所必备的 基础设施。2019年9月2日,互联网金融风险专项整治工作领导小组、网贷风险专项整治工作领导小组联合发布《关于加强P2P网贷领域征信体系建设的通知》,支持在营P2P网贷机构接入征信系统。
互联网金融从业机构为了对用户的消费习惯、风险偏好和信用状况进行全方位了解,产生了大量身份识别、信用评估、用户画像、反欺诈等多方面的信用服务需求。
相对于传统征信,市场化个人征信可以覆盖更多的弱势群体,如广大农户、创业者、个体工商 户、大学生等,是互联网金融业务进行风险控制和产品定价的关键环节。
消费金融的快速崛起对个人征信的市场化发展
产生了巨大的推动作用。自2015年起我国互联网消费金融进入快速增长期,根据艾瑞咨询的统计数据,2017年交易规模达43847.3亿元,环比增长904.0%。
互联网消费金融体现了消费金融与大数据风控的深度融合,从而获取到传统消费金融所无法覆盖的长尾客户,促进了消费金融应用场景的拓展。市场化个人征信可以有效解决长尾客户的白户问题,形成新的消费能力,减少潜在的信用风险,降低消费信贷的交易成本。
共享经济的高速增长形成了对市场化个人征信 的新需求。根据国家信息中心发布的《中国共享经济发展年度报告(2019)》,2018年我国共享经济交易规模达29420亿元,环比增长41.6%。
共享经济是典型的信用经济,资源拥有者和资源使用者基于双方信任通过互联网平台完成交易,信用免押模式更是其主流趋势,因而共享经济平台的信用体系建设是其发展的要点。
市场化个人征信可有效解决共享经济中供需双方的信任问题,降低交易门槛,提升交易效率,使用户可以充分享受信息互通和资源共享带来的便利。
二、我国个人征信的行业格局
我国征信业历经二十余年的发展,形成了 “政府+ 市场”双轮驱动的征信体系,以央行征信中心为核心、 以民营征信机构为补充。
1997年,央行批准上海资信有限公司进行个人征信试点。2004年,央行个人征信系统的建成弥补了我国个人征信业的空白,意味着我国金融基础设施建设向着更完善、更健全的方向发展。
随着个人征信市场化进程的加速,2013年1月国务院发布《征信业管理条例》,明确征信业向第三方机构开放,民营征信机构迎来了新机遇。
在百行征信成立之前,2015年1月央行曾发文要求8家民营机构做好个人征信业务的准备工作,然而随着互联网金融整治的不断深化,此后并没有为其颁发个人征信牌照。
事实上,8家民营机构的准备工作与征信市场 的需求、政府监管的要求都存在一定的差距,普遍存在个人信息采集和使用不规范、业务经营范围不明确等问题。
一方面,8家机构有各自的利益诉求,大都不愿将自己所掌握的信用数据同公众或其他机构 共享,形成的“数据孤岛”严重阻碍个人征信业的健康发展,不利于社会信用体系的建设和升级。
另一方面,8家机构在个人信息保护方面大都存在明显的疏漏,对用户数据的过度挖掘和商业化使用导致个人信息灰色产业链隐藏着巨大的风险。
个人征信具有公共或半公共服务的属性,个人 征信市场的对内开放应坚持在风险可控的前提下高水平发展的原则,确保市场准入的机构是具备社会公信力和市场竞争力的机构。
基于此,央行批准百行征信的个人征信牌照,引入8家民营机构为股东、中国互金协会为控股股东。百行征信的成立,意味着形成了一个各大民营机构信用数据的大熔炉,将政府的监管和市场的参与统筹兼顾。
它针对央行征信以外的领域(主要是互联网征信领域)开展个人征信活动,与央行征信中心形成“错位发展、功能互补” 的市场格局,在注重个人信用服务公益性和公正性的同时,也给信用服务市场留有较大的发展空间。
由表1可见,央行个人信用信息基础数据库和 百行征信的数据源存在少量交集,但绝大部分不重合,未来两者存在数据互通的可能性。
百行征信的数据源以互联网数据为主,数据采集维度更加广泛, 征信产品更加丰富,服务对象更加多元。其应用场景除了传统的信贷领域之外,也在向生活服务领域延伸。新的应用场景有助于拓展百行征信的市场空间,提升用户体验度和忠诚度。
三、个人征信市场的产业链概况
(一)个人征信市场的产业链结构
百行征信在业务开展中主要采用互联网征信模 式,其产业链结构如图1所示。
征信产业链上游是互联网数据提供商,包括各类网贷平台、电商平台、 支付平台和社交平台等,它们在各自的业务中收集并存储了大量用户数据,并对这些数据进行初步的清洗和标准化处理。
位于中游的百行征信是整个征信产业链的核心,它负责对分散在多家数据提供商的信用数据进行采集、汇总、加工、分析和挖掘,继而开发出信用报告、信用评分等多层次的征信产品和服务供下游机构使用。
产业链下游是网络信贷、消费金融、共享经济、生活服务等多元化的应用场景, 相对于传统征信,更倾向于“小、轻、快”的信贷业务。
(二)百行征信的数据服务商
百行征信自成立以来业务推广迅速,截至2019 年7月,已与976家机构签订了业务合作和信息共享协议,合作机构涵盖互联网金融、消费金融、汽车金融、金融科技等多个行业的领军企业,采集借款人数逾6300万、信贷账户数达1亿个。
此外,已与最高人民法院执行局、三大电信运营商、中国银联等机构确立合作关系,与全国公民身份证号查询服务中心、 学信网、公积金管理中心、社保中心等互联网化的公共数据接洽合作事宜,在个人征信领域的公信力和影响力日趋壮大。
根据互联网公开信息进行不完全统计,百行征 信的部分数据接入机构如表2所示。
百行征信和其数据服务商之间呈一种双向促进、协同发展的态势。
一方面,根据合作协议,接入机构作为百行征信的数据提供者,有义务全面、准确、及时地报送与个人信用相关的业务数据和历史数据,如个人基本信息、借贷信息、失信记录等,极大地丰富征信数据体系,打破征信市场的数据孤岛。
另一方面,接入机构作为百行征信的服务对象,从中获取信用信息 查询等征信产品和服务,可有效应对多头借贷、中介欺诈、团伙欺诈等风险,全方位提升自身在贷前审查、贷中管理、贷后预警等各环节中的风控能力。
(三)百行征信的参股机构
作为百行征信的发起人和控股股东,中国互联 网金融协会具备强大的社会公信力和丰富的行业资源,可以为百行征信的数据体系建设提供坚实的基础。
其机构会员的数量超过500家,此外,在其开发的互联网金融统计系统中,截至2019年7月,共有 300余家互联网金融从业机构报送数据,涵盖网络借贷信息中介、网络小贷、消费金融、P2P借贷等多种个人信贷从业机构。
先前开展个人征信业务准备的8家参股机构不 再单独从事个人征信业务,其原有个人征信业务将剥离,并入百行征信,其他业务存续为数据或风控服务。这8家参股机构可以说是个人征信业的霸主, 在数据资源、技术能力、征信产品等方面各具特色, 如表3所示。
这8家机构大体可以分为三类:
(1)以互联网企业为背景的信用服务机构,包括芝麻信用和腾讯信用,其优势在于通过互联网平台积累的电商交易数据、社交网络数据、互联网行为数据等海量大数据资源。
(2)以金融机构为背景的信用服务机构,包括前海征信、考拉征信和华道征信,其优势在于拥有较全 面的金融综合牌照和较成熟的全局风控经验,并积累了强相关度的金融属性数据。
(3)老牌信用服务机构,包括鹏元征信、中诚信征信和中智诚征信,这三家机构具备资深的信用服务经验、丰富的征信模型技术、良好的行业口碑,然而缺乏直接、广泛的数据 源,面临着一定的发展约束。
从所使用的技术来看,8家机构都不同程度地 运用先进的大数据技术和机器学习算法等对信用评分模型进行创新和探索。其信用产品各具特色,大都涵盖身份认证、信用评分、风险监控、用户画像、反欺诈服务等内容。
鉴于百行征信定位为市场化征信机构,意味着8家参股机构按照市场化原则自愿上报数据,不存在强制性,不过百行征信由中国互金协会牵头和控股,有望通过行政手段让其他民营机构参与信息共享。
四、百行征信的核心竞争能力
(一)百行征信的产品优势
目前百行征信已成功研发并推出个人信用报 告、特别关注名单和信息核验平台三款个人征信产品,自开放查询以来,累计查询量超过700万笔。三款产品的主要功能如下:
(1) 个人信用报告:可查询个人在多家机构的 申请记录,按照风险定价原则反馈信贷产品的额 度和利率信息,检测个人资产质量的状态和还款情况等。
(2) 特别关注名单:可识别潜在的信用风险人 群,防范多头借贷和恶意骗贷,且名单变量具有可解释性,可引入用户的风控模型当中。
(3) 信息核验平台:含手机运营商多要素核验、 银行卡多要素核验、灵活定制组合或专项核验等。
此外,百行征信正在利用先进的金融科技来丰 富自身的产品线,计划在2019年内与其参股股东共同开发反欺诈报告、反欺诈评分、欺诈关系图谱等新产品。随着征信应用场景的日趋丰富和市场化激励机制的逐渐成熟,多层次的信用产品和服务必将成为百行征信的发展趋势。
百行征信的产品相对于其他民营机构的同类型 产品具有明显的优势。其征信数据体系更丰富,数据提供商涵盖消费金融、汽车金融、网络借贷等多个行业的领军企业,大量接入机构系首次对外共享信贷数据,三大电信运营商和各类公共机构的数据也在持续接入中。
数据接入采用一站式方式,数据质量管理贯穿数据接入的全过程,数据标准和格式更加统一,数据的可靠性、准确性和实时性更强。同时更加注重个人信息保护,数据源均经过严格、完备的合规性授权管理。
(二)百行征信的技术优势
以大数据、云计算、区块链和人工智能为代表的金融科技为百行征信的发展注入了新的活力,目前百行征信正致力于数据中台的搭建,将其作为征信数据的集成平台和共享中心,为上层业务和应用提供数据和计算支撑。
数据中台的概念最早由阿里巴巴提出,它是指利用大数据技术按照统一的标准和口径对海量数据进行采集、存储、加工和计算。
利用数据中台可以对分散的征信数据源进行汇聚、 治理和统一,形成标准化的数据资产,匹配多元化的业务需求和应用场景,与更多合作机构建立信用产业生态链。
数据中台的基本结构如图2所示,它能提供的 主要功能如下:
(1)数据汇聚:征信数据源具有多源、多样、多域的特点,涵盖结构化数据、非结构化数据、离线数据、 实时数据、日志文件等。通过数据资源的规划、获取、盘点、清洗、统一存储、汇聚链接等技术手段,对征信数据进行融合打通和关联建模,形成清晰的数据资产,提升数据资源的利用率。
(2)数据治理:具体包括元数据和主数据整理、 数据质量管理、数据标准管理、数据安全管理、数据生命周期管理等内容。利用元数据进行数据地图和 数据血缘分析;利用主数据提高征信大数据的质量; 对数据质量进行实时校验并报送数据污染;使用脱敏技术对敏感信息进行授权访问以保证数据的安全性;制定数据生命周期规则来处理过期数据等。
(3)数据开发:主要包括标签管理、算法开发、模 型开发等内容。开发出标签库对用户、产品、机构、 信贷、营销等多个主题域进行标签提取,将其特征数字化,为后续进行用户画像和精准营销提供必要条件;提供大数据征信中常用的机器学习算法,如 Logistic回归、决策树分类算法、人工神经网络、深度学习、支持向量机、随机森林、GBDT、集成学习等;基 于机器学习算法开发出申请评分、行为评分、催收评分等多维度信用评分模型库。
(4) 数据服务:将数据开发的成果(标签、算法、 模型等)封装成数据服务,构建数据API接口,以API 等方式向业务层提供通用的数据服务接口,业务层在此基础上实现数据服务的个性化应用,开发出多元化的征信产品和服务。这种方式可以实现数据服 务的复用,提升对征信业务需求的响应效率。
五、百行征信面临的挑战
(一)数据安全是百行征信的生命线
在大数据时代,个人信息是征信业发展所不可 或缺的数据资源。金融科技的应用提升了数据获取和数据共享的效率,但在一定程度上也给数据安全和信息保护带来了新的隐患。信息安全事故在互联网行业屡有发生,违法违规使用个人信息的问题十分突出。
国家互联网应急中心发布的《2019年上半年我国互联网网络安全态势》显示,随着移动互联网和普惠金融的大力发展,出现了大量未经信息主体授权或者超越授权范围而采集、报送、查询、使用个人信息的现象,例如某些网站利用默认勾选的隐私条款获得用户授权,或者以移动端为入口强制授权和过度索权,甚至通过恶意软件、木马病毒、免费 WIFI等超范围收集个人信息。
百行征信的数据源涉及大量敏感且机密的个人 信息,这些信息的泄露、毁坏或丢失将对其业务造成巨大的损失,带来恶劣的社会影响甚至严重的法律后果。确保信息主体的信息安全与合法权益是百行征信必须承担的责任。
一方面,应严格按照法规制 度和监管要求开展业务活动,在个人信息的采集时要确保经过了信息主体的明确授权,并且在授权范围内使用,维护信息主体的合法权益。
另一方面,需要对征信系统的技术防范措施进行定期检查和更新,从技术上杜绝征信信息滥采滥用等数据安全隐患。
在百行征信成立的同时,我国个人信息保护相 关的政策法规也在确立当中。被称为“史上最严格个人数据保护法案”的《欧盟通用数据保护条例 (GDPR)》已经在欧盟正式实施,它对个人用户在隐私数据方面享有的权利(查阅权、被遗忘权、限制处理权、数据移植权等)以及企业在处理个人数据时的合规性要求做了详尽的说明。
目前我国相关部门在适当借鉴GDPR的基础上,正加快《个人信息保护法》的立法进程,平衡数据共享与信息保护之间的关系,为个人征信业的规范化发展创造良好的法律环境。
(二)数据质量是百行征信健康发展的基石
百行征信的数据源是以大量、分散、多样、碎片化、非结构化的互联网数据为主,普遍存在数据源格式不统一、数据缺失多、数据接入成本高、数据整合难度大等问题。解决数据质量问题是百行征信的当 务之急和长期健康发展的基础,在确保数据安全的同时必须将数据质量管理贯穿于征信业务开展的全过程。
加强数据质量管理是百行征信和数据接入机构 的共同责任。首先应制定清晰、统一的数据标准,明确接入机构的责任,对接入数据进行统一归口管理。数据标准具体应考虑以下几个方面:
(1)合规性,数据应满足央行的监管要求,符合信息安全和个 人信息保护方面的政策法规;
(2)可靠性,确保数据 从具备社会公信力和市场竞争力的机构获得;
(3)完 整性,减少数据缺失或空数据的情况;
(4)准确性,避免出现异常或错误数据;(5)—致性,来自不同数据 仓库分支的同一份数据应确保一致;
(6)实时性,鉴 于互联网平台的数据更替日新月异,数据采集应达 到小时或实时级别。
在技术方面,可利用Hadoop等大数据技术对分 散在不同数据服务机构、碎片化的底层数据进行分 布式加工处理,形成完整的全局信息,并利用数据中 台进行数据标准化处理和数据质量的实时校验。
(三)市场化运营是百行征信可持续发展的动力
不同于行政机构或公益组织,百行征信定位为 市场化征信机构,高效的运作和稳定的盈利是其可 持续发展的重要保证。
百行征信致力于与广大互联网金融从业机构之 间建立信用信息共享机制,打破数据孤岛,从而降低信贷业务的交易成本,提升个人征信市场的效率。鼓励数据服务商积极共享和更新信用数据,除了运用行政的力量之外,应充分利用市场化激励机制。
征信数据是一项具有价值的无形资产,但如何衡量其市场价值目前仍没有定论。可考虑从征信数据的使用频率、稀缺性等角度对其进行定价,也可采用当下热门的区块链技术,利用智能合约对信息所有者实现自动化、公平化的激励。
百行征信的服务对象已从传统信贷领域拓展到 网购、教育、医疗、购车、租房、出行等消费生活的许多方面,但目前其征信产品仍十分有限。为了满足征信市场上多元化的需求,应开发出更丰富的征信产品和服务,全面提升产品的市场竞争力。
六、小结与展望
百行征信的成立体现了“政府+市场”双轮驱动的新型征信模式,是央行征信的有力补充,对我国普惠金融的实施和社会信用体系的建设将产生深远的影响。
它提升了个人征信服务的覆盖率和可得性, 解决了央行征信触及不到的长尾人群的征信白户问题,有助于消除贫困、改善民生、促进创业、提升民众的生活质量。它与互联网金融、消费金融、共享经济等行业的广大企业之间建立了有效的信用信息共享机制,有助于解决互联网征信领域的数据孤岛和多头借贷问题。
它也树立了征信业个人信息保护的新标杆,为互联网营商环境的规范化发展和互联网金 融从业机构的稳健经营提供助力。