中国商报社主办
您当前的位置: 首页 > 传媒 > 人物 > 正文

专访丨星融金服CTO余新卫:互联网金融征信中的信用评分模型

【导读】对于目前的互联网金融发展来说,其内在的风控模式实际意义区别于一般金融机构的信贷审核机制,与传统金融行业相比,存在着缺乏组织抵押和实际信息不对称等问题。现阶段,计算机时代到来,呈现出大数据迅猛发展和机器学习算法普及的特点。这造就了智能化进程加快,人工智能化发展正在崛起。本文主要以人工智能背景下互联网金融信用评分模式为基础,探讨人工智能在互联网金融方面的实际应效果与存在形式进行分析。计算机时代必将影响整个互联网金融行业,要充分利用人工智能化技术优势与信用评分模式完美结合,金融行业风险控制智能化发展必是未来的时代主流。

【人物介绍】

余新卫 CTO

毕业于华中科技大学计算机系,获工学学士

专注领域:分布式,微服务,高并发,互联网金融、区块链

曾任 UT斯达康(深圳)科技有限公司 技术负责人

深圳宜搜天下科技股份有限公司 高级技术经理

上海星融财富投资顾问股份有限公司 技术总监

中国计算机协会、中国电子学会会员

金融机构面临的最大问题就是交易风险。传统分析按评估的主要标准是收入、婚姻、财产状况。在抵押方面需要有一定价值的物品。现阶段互联网的发展突破以前的黄金准则,把大数据和计算机算法应用其中。人工智能评分模式成为互联网金融的重要组成部分。本文主要从应用和现实挑战两点进行分析研究。

一、互联网金融征信中的人工智能评分模型

1、模型应用

人工智能在互联网金融行业得到广泛使用,主要负责建立真实的业务场景模型,业务模型有自主调节的优点。人工智能的数据分为训练数据和检测数据,这两类数据具有永恒增长性。人工智能的信用评分模式多种多样,选取以下几种进行分析:Logit模型。它是(LDV)框架的发展结果,客户简单分成“好”和“坏”两类,0.5是确定他们区间的标准。信用评分模式是衡量客户未知信用的标准,实际信用是不可测的。实际信用成为潜变量Y*,信用模式就是用函数关系把潜变量数值变成可观测的结果。人工智能的作用就是保证函数关系转化的实验数据贴近Y值。最后确定影响客户信用的因素并进行评分。

2、LDV的模式框架

LDV的模式框架如下:,这里是潜变量,是转换函数,它使的取值变成观测数据.加入0成为观测数据分类的标准,取值概率如下。显然,LDV分析框架下,模型的具体形式就取决于累计分布函数的形式,如果是 Logistic 分布就是模型,连接函数,因变量取值概率;模型评价以拟合优度、正确预测百分比和KS曲线为标准 百分比P值0.5,潜变量Y值=1.百分比正确算法就是用正确结果除以总数。而KS曲线表示好坏客户累积概率差的最大值,是决定模型能力好坏的重要因素。好坏客户信用分布存在较大差异,好客户分布在信用评价较高的区域,坏客户将相反。

3、支持向量机。

(1)支持向量机最早在20世纪90年代由Cortes和Vapnik提出,在以后的发展中广泛应用。它的实质是智能计算的分类算法。它属于二分类模型概念,应用原理是在特征空间内利用线性分类器扩大间隔,具体算法是凸二次规划问题求解过程。支持向量机具有兼顾训练精度和泛化能力关系的作用。它在很多方面都有很大优势。比如:小样本和模式识别等方面。

(2)信用评分模式最常用的手段是线性可支持向量机,这种情况下,训练数据属于线性可分范畴,并且能保证此时的解具有唯一性和最优性。在实际的信用评估中,违约和不违约定义成两分类变量,对训练数据来说,寻扎具有扩大间隔的分离超平面。假设分离超平面由:表示,那么,这个最优化的分离超平面会由最后化问题得到:对应决策函数是:

二、面临挑战

1、模型泛化能力较弱

互联网的实际应用场景各不相同,技术人员在建立模型的过程中呈现出过于注重训练效果和单一业务数据的缺点。这是建模能力偏弱的原因。新建模型在实际操作中会出现缺乏审核能力和模型预测不准确等缺点。有的机构会出现人工审核过程,没有在实际应用中完成对人工智能评分的发展。

2、新型模型在发展过出现过度复杂和拟合显现严重等问题

人工智能比传统的信用评分方法在很多方面都存在优势。比如,以人工智能为基础的评分模型不需要假设变量假设,也可以直接在训练数据中获得数据信息,并且可以快速完成解析。它与传统的线性评分模式相比,人工智能具有灵活和高效的特点。在现阶段信用评分模式的发展中,很多技术人员注重拟合结果,在变量建模方面存在采取过度复杂和过度严重的特点。这种情况导致拟合现象不符合实际测评。效果严重低于预期目标。

3、交叉验证机制流于形式

人工智能要想取得良好的学习能力,就需要建立一个合理明确的交叉验证机制。这个验证机制需要在训练数据和检测数据两方面进行分析,同时,也要不断增加建模的学习能力。但是,很多企业只是把数据分成简单的训练数据和检测数据两方面。企业大部分员工工作能力互不相同,技术水平良莠不齐。这导致企业没有深入的了解和研究数据生成体系,只是停留在表面阶段,在数据模型方面,难免存在误差。

4、 同行业竞争

互联网金融行业的人工智能模型发展呈现出“百花齐放,百家争鸣”的繁荣景象。但是,在发展快速的今天,仍然没有一个全行业都认可的规律体系去维持人工智能工作的标准。这就是人工智能繁荣状态下的阴影。它是企业只顾发展速度不重质量造成的。这就导致很多行业泡沫的诞生。现阶段的人工智能也存在很多不足,比如,进入门槛太低、判断标准不清、甚至还有很多情况下出现炒作的现象,这都不利于互联网状态下金融领域人工智能的全面发展。归根结底,还是没有一个行业标准来指导和规范人工智能合理发展。

在未来的互联网金融行业发展中,人工智能必将是风险调控的主流。但是,这不说明我们目前我们的互联网人工智能信用评分模式就没有问题,现阶段,我们的问题主要体现在模型错用、过拟合现象普遍、泛化能力较弱、泛化误差较大、技术人才稀缺和现有人员技术水平不高等方面。在人工智能迅猛发展的时代条件下,我们不仅要把握发展机遇,更要注重发展质量。我们要明确人工智能的发展目标和营运领域,即,实在互联网金融领域针对用户的信用标准进行人工智能测定。这也是我们实现全行业自主化和智能化的重要组成部分。我们要根据智能化信用评分的优势减小企业运营成本,明确客户的信用状态,从而提高金融行业的总体效益。

声明:本文仅代表作者个人观点,本站不对内容的真实性、完整性、准确性给予任何保证或承诺,仅供读者参考。

分享到:

关于我们   广告服务   诚聘英才   网站声明   联系我们  

互联网新闻信息服务许可证    京ICP证101100    京ICP备14002229号-2    京公网安备110102005801-2

  中国商报社 版权所有