每日经济新闻
要闻

每经网首页 > 要闻 > 正文

大数据在征信业的应用不能过于偏重消费金融

每日经济新闻 2018-05-14 21:36:28

在当下普遍的征信体系中,消费金融历史交易记录是它们主要提供与参考的数据。而且在这一领域的竞争目前也非常激烈。但仅仅依赖消费历史记录是不够的,在方法上还需要改进,如果能增添进诸如银行开户信息、申请信用卡信息、贷款与租赁等类别的合同信息,将有助于完善原有模型。

王倩

近日,央行下发《关于进一步加强征信信息安全管理的通知》(银发〔2018〕102号文,简称“102号文”),要求进一步加强金融信用信息基础数据库运行机构和接入机构征信信息安全管理。

此前在2018年人民银行征信工作会议上,央行强调,2018年征信工作要坚持问题导向和目标导向相结合,紧扣经济高质量发展、社会主要矛盾转化与打赢防范化解重大风险攻坚战与征信业发展的内在联系,牢牢把握征信事业发展方向,开创征信管理履职新作为新气象。

图片来源:视觉中国

随着我国金融产品种类与业务的快速发展,金融市场对外规模日益扩大,尤其是互联网信用体系等的高速发展,征信业的重要性越来越大。但与金融市场迫切的需求相比,我国当前的征信业还处于很弱的发展初期阶段。

那么征信业究竟存在哪些问题,如何将其不断完善与发展呢?我们可以从大数据对征信方法与流程所发挥的作用角度进行讨论。

征信是指为个人或机构过去的信用历史提供信息,从而帮助人们判断借款人的还款可能性。对于企业,征信的任务通常是由信用评估机构来完成的;个人的征信记录则是由个人征信机构来完成。

征信的意义在于,它可以帮助提供贷款的人或机构理解借款人的信用风险以及其还款的可能性。征信存在的理论基础是,从过去人们的信用行为特征中,可以帮助判断其未来还付贷款的可能性。但是它不能够足够保证借款人绝对百分之百地偿还部分或全部贷款。

从方法上,个人的征信评估通常采用的是评分(Scoring)方法,它是建立在数理统计预测的基础上的。评分方法首先关注的是相关领域的信息,既有来自问卷咨询、官方信息,也包含一些半官方信息。

当前大数据的发展应当说为获取更多、更高质量的信息提供了捷径。但是人们不能忽略的是,获取的数据要经过严格的筛选与定性。对于成熟的征信系统,其获取信息与数据要不断随着社会现象的发展而不断进化的。例如在德国,其征信机构曾经尝试将脸书(Facebook)纳入其征信信息系统中,将其信息用来评估个人的信用积分。

虽然拥有海量信息与大数据,征信的评估过程仍旧要有人工的参与,完全依赖机器的算法是达不到最终信用评估的结果的。

例如,从脸书中,人们可以通过人脑对信息的理解、思维、判断等,来借助人与人之间的关系识别个人的信用度(通常借助于其谎言出现的频率等)。在这一点上,只有人脑通过判断才能够达到目的,机器算法在这里是无能为力的。

另一方面,并不是所有这些海量的数据都有利用价值。人们首先要有一个模型,究竟哪些数据有用,哪些数据价值不高。虽然现代科技使得人们可以更加方便地获得大数据,但是拥有几个说服力强的模型是首要任务。只有那些与模型相关的、能够测量信用积分的数据才有意义。

对于传统的征信方法,人们专注例如姓名、住址、通讯方式等基本信息,接下来更重要的、能帮助判断其财务能力的一些信息还包括过去的支付历史、拥有房产状况(其中包括是自有方式还是租赁方式)、银行账户信息、贷款与租赁合同、信用卡信息、网购的客户账户、贷出款项信息等。

中国人民银行征信中心个人征信系统采集的信息覆盖个人贷款、信用卡、担保等信贷信息,以及个人住房公积金缴存信息、社会保险缴存和发放信息、车辆交易和抵押信息、法院判决和执行信息、税务信息、电信信息、个人低保救助信息、执业资格和奖惩信息共计8类公共信息,涉及的数据项超过80项。与市场上存在的互联网征信与信用评估机构相比,该系统获取的信息种类与规模大不相同,它比互联网征信系统要完善得多。

征信的结果针对企业与个人,其用途也不一样。信用评级公司为企业做信用评估的结果可以直接被用于判断其违约可能性。而针对个人的征信结果,通常是为客户提供参考意见。

在当下普遍的征信体系中,消费金融历史交易记录是它们主要提供与参考的数据。从正面角度来说,这些消费金融的记录有助于人们评估消费者的信用度;但是从负面来说,受制于现代科技安全手段的局限,常存在一些伪造数据记录的现象,从而其效果也一般。

我国民间的网络征信系统当前竞争很激烈,但是它们在方法上需要改进,仅仅依赖消费历史记录是不足的。

我们建议,如果能通过合法的途径,增添进去例如银行开户的信息、申请信用卡的信息、贷款与租赁等类别的合同信息(包含是否及时归还按揭贷款、是否按照约定的额度归还贷款)等方面与个人信用行为相关联的信息,都有助于完善原有模型。

此外,尤其是小额消费贷款,其区别于普通消费贷款的一个重要特征就是:无还款意愿是其违约的主要动力。这一点必须是通过人为的审核才能够被识别。征信系统要配合人为判断,才是更好的解决办法。

此外,从方法上我们还建议引入权重的概念。征信记录的历史数据,随着时间的演变,其权重也会发生变化。人们在最开始的记录得出信用积分,其权重要低于最新得出的信用积分。换句话说,最近的关于个人信用度的信息,其重要性要高于很久以前获得的关于个人信用度的信息。随着数据库的不断扩大,这一点的重要性也愈加明显。这表明数据库的信息定期更新起着不可忽略的作用。

我们还建议,民间的网络征信系统要采用人工智能与专业人员人为判断相结合的方式。纯粹依赖人工智能和仅有的大数据,其结果不会理想。

其原因在于,当前人工智能的算法远达不到替代人脑的程度。信用评分的结果不仅是交易记录得来的,它在一定程度上还依赖着数量统计的方法。一方面,数理统计帮助人脑判断的方法存在局限性;另一方面,在有的领域,运用数理统计的方法来替代人脑在当前还只是天方夜谭。(作者为金融学博士、同济大学副教授)

 

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

版权合作及网站合作电话:021-60900099转688
读者热线:4008890008

特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

大数据 征信 金融信息 消费金融

欢迎关注每日经济新闻APP

每经经济新闻官方APP

0

0