在中小微企业风控场景中,几个重要的模型开发包括企业营业额预测模型和还款能力模型(信用评估)。这两个模型可以类比于个人零售信贷场景下的收入评估和信用能力预测模型,可以看作是中小企业风控中的两个核心风险维度评估。下面我们就来说说吧。
一、业务能力预测
1.1. 运维能力预测,整体的建模思路,可以参考大概的步骤是:
① 用公司过去三年的营业额来预测未来12个月的营业额
② 多模型效果验证,让实际数据选择最优模型
③自动迭代优化流程,充分利用人工智能实现全线全流程自动化
④ 定制模型策略,每个企业独有的模型参考指标系数
1.2. 参考我们以往开发的模型项目,模型效果可以达到以下数据:80%以上的客户预测误差小于50%。效果示例如下:
关于本次经营情况的预测内容,具体实战操作可参考番茄风控前期内容:
营业额预测模型的开发| 基于电子商务借贷周转模型的实战开发
2、小微信用评价模型(逾期模型)
小微信用评价模型也可以称为逾期预测模型。不良信用会导致违约。参考我们之前项目开发的相关数据,要实现一个比较好的模型,其大概的数据维度需要满足以下条件:
①数据来源于10万余笔真实还款样本;
② 并基于现有递增的实际生产数据,迭代优化模型;
③ 同时细分行业,整合工商、司法、财税、发票、企业基本信息等建模变量,全方位评估企业信用状况基于收入的风险额度基准值测算,使用至少三年的历史数据。
模型训练后的评估结果:
KS达到0.6以上,模型稳定性好,无论是通用场景还是行业特定场景的可预测性都有很好的保证。
训练集:roc_auc=0.7401
测试集:roc_auc=0.6321
整体:KS值=0.6741
针对历史数据不全(历史3年)、财税发票数据缺失值的客户,我们使用梯度提升树LightGBM构建信用评分模型。KS达到0.4左右,模型通用性好。
另外,在模型开发中还有一些细节需要注意:
①模型使用梯度提升树LightGBM,个人参数参考(num_boost_round=5000,early_stopping_round=500);
②模型会存在一定的过拟合风险,这个问题以后会随着样本数量的增加不断迭代优化。*由于数据可能具有一定或较强的非线性表达能力,在后面对树模型进行迭代时,可以进行深度神经网络的模型训练;
综上所述,模型开发完成后基于收入的风险额度基准值测算,一般的指标参考大概是:
ROC高达0.76;
KS高达0.36;
模型整体效果还是不错的:
关于以上中小微财税发票中数据和模型相关的内容,感兴趣的童鞋可以关注
《财政发票数据在中小微企业风控中的运用与模型开发》:
...
~原创文章
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
