log in
register

READ: 互联网金融时代消费信贷评分建模与应用

Qingqi@2020-07-20 #read

原日期: 2018年4月

简介

  • 管理信息系统 MIS management information system
  • 企业资源规划 ERP enterprise resource planning

  • MIS:

>> 信息管理
>> 分析研究
>> 项目管理

常用指标

  1. DPD days past due 逾期天数
  2. bucket 逾期期数 一般为30天或一个自然月
    • C/M0, M1,M2,M3,M4+等
  3. stage 逾期阶段
    1. front end 前期
    2. middle range 中期
    3. hot core 后期
    4. write-off 转呆账
  4. month end/cycle end 月底结算/期末结算
  5. delinquent% 延滞率,逾期率 逾期金额/应收账款
    1. coincidental 即期指标,使用计算时当月应收账款
    2. lagged 递延指标,使用源头月份应收账款
  6. bad% 不良率
  7. WO% 转呆账率
  8. NCL net credit loss 净损失率
  9. 审核(进件)/核准/拨款:件数/金额
  10. 核准率
    1. 当月核准量/当月进件
    2. 当月核准量/(当月核准量+当月拒绝量)
  11. DBR 负债比 客户无担保债务余额/平均月收入
  12. 月负比 (预估每月贷款还款额+最低生活支出)/月收入
  13. non-starter% 恶意延滞率
  14. flow through% 迁移率 前期逾期金额落入下一期的几率
    1. 比如: M2-M3, 从M2落入M3的比例
    2. 计算: 这个月的M3/上个月的M2,也就是说,在表格中是阶梯相乘的
    3. 使用迁移率需要注意催收人员的逆选择问题
  15. 累计迁移率accumulate flow through% / 滚动率Roll Rate:
    1. 就是累计的迁移率
    2. 比如: C->M2: 上月的C-->M1 * 当月的M1-->M2
  16. 呆账回收率 呆账回收金额/呆账金额

分析方法

  • 核准率的上升有可能会带动延滞率提高,这两个指标代表业务增长与风险增加,这两个对应指标应该同时并列于报表中以供阅读者权衡利弊
  • 指标选择需要考虑多个方面
  • 有多个分析维度:产品/行为/基本数据 等
  • 实验设计,常用测试方法
    1. 定时测试
    2. 定量测试
    3. 定性测试
  • 度量方式; 值,百分比,平均数 等

预测方法

信用评分 ★

评分模型开发

  1. 确定评分目的 略
  2. 基本定义
    1. 观察期: 变量计算的历史期间,比如:近6个月
    2. 绩效期: 准备预测的时间长度,比如预测客户未来12个月的违约概率
    3. 违约定义: 比如M2+逾期,催收,呆账,强停,等
    4. 灰色地带客户: 很难判断好坏的特征,比如半年内出现一次M1
      • 可以利用转移分析(roll rate analysis有歧义)来判断一个特征区分是否准确
      • 见 /python/转移分析.ipynb
    5. 样本区隔,根据客群或产品,开发数个子评分卡
  3. 资料准备
    • 客户申请资料,内部数据,外部数据
  4. 变量分析
    1. 长清单:有可能影响风险的变量,数量众多,需要检查多重共线性,保留部分变量
    2. 单因子分析,检测各个变量的预测强度
      1. 分组的原则:组间差异大,组内差异小,分组占率不应低于5%
      2. WOE weight of evidence 迹象权数
        • WOE = In(正常件占比/违约件占比)
      3. IV information value 信息值 / VOI value of information
        • IV = 求和((正常价占比-违约件占比) * WOE)
        • <0.03 无预测能力
        • >0.5 预测能力极高
      4. 见 /python/变量分析.ipynb
    3. 筛选出 短清单
  5. 建立模型
    1. 抽取建模样本时,会可以将违约样本的比例增加
    2. 需要留测试组样本
    3. 可使用log回归
    4. 对数分数应当转化为得分,使不同评分卡的风险尺度统一
  6. 婉拒推论
    • 推测被拒的历史单的表现,已完善数据,进行模型修正
    • 单纯扩充法: 根据模型初步结果推算婉拒客户的违约率,以特定违约率区分客户是否违约
    • 分群法: 根据初步模型将核准用户和婉拒用户分别划分为10~20个分群,根据核准用户不同分群的违约率,在婉拒用户不同分群中随机分配违约预测
  7. 效力验证
    • 样本外验证,时间外验证
    • K-S value (区隔力指标)
      • K-S value = max(abs(bad%累计-good%累计))
      • 0.5-0.75为佳
    • gini coefficient 基尼系数 (区隔力指标)
      • 横纵轴分别为累计bad%和累计good%的洛伦兹曲线
      • gini = 曲线和45度线之间的面积/0.5
      • 越大越好
    • PSI population stability index 稳定度指标
      • PSI = 求和((测试样本下占率-开发样本下占率)*Ln(测试样本下占率/开发样本下占率))
      • 小于10&为佳
Comments

Log in to add your comment

Don't have an account? register here