与申请评分卡不同,行为评分卡采用的数据为借款人的行为数据,通过对历史行为特征分析预测未来可能发生违约的概率。数据来源分为内部数据与第三方数据。内部数据即为借款人的还款行为数据、历史的还款表现、设备指纹数据(如借款人在还款期间平台登录情况与平台操作行为数据等) 。第三方数据需要购买,这类信息对建模作用很大。该类信息包括还款期间其他平台的借款情况、近期的消费情况、银行流水、行为轨迹等。
与申请评分卡不同,行为评分卡模型的特征工程更重要的是做时间切片特征。时间切片是指以观察点为起点向前追溯一定时间,并计算时间窗口内的统计特征,时间切片示意图如图3-9所示。例如可以计算时间窗口OA=2,即2个月的统计特征;OB=4,即4个月的统计特征;OC=6,即6个月的统计特征。当然,还可以求由OA、AB、BC组成的趋势特征,来衡量借款人行为习惯的变化趋势等。[插图]图3-9 时间切片示意图有了时间切片的概念,下一步是寻找基本特征,可以从平台内部数据与第三方数据两方面考虑。
1.平台内部数据
借款人真实的逾期情况:如观察期窗口的逾期状态,可以统计不同时间切片下的最大逾期状态、逾期总天数、逾期次数等特征;还可以衡量OA、AB和BC三个阶段最大逾期状态的变化趋势,判断是否有恶化或好转的情况。实际还款率计算:因为产品一般会有最低还款额度,如果借款人当月资金短缺可以按最低额度还款。另外,最低额度借款人都无法偿还或者由于临时忘记还款而导致逾期几天则会有罚息处理,这样每个月的还款压力是不同的。因此,可以用每月的实际还款率衡量借款人的还款情况。实际还款率=本月还款总额/上个月应还总额,如借款人正常还款情况下每个月应还总额为1000,但如果有罚息或执行了最低还款,则下个月的应还总额会增加。当然,可以求时间切片特征,如最大值、最小值及趋势特征等。设备指纹特征:如登录次数、用户操作等信息,以及时间切片特征。
2.第三方数据
第三方数据往往需要购买才可以得到,其对行为评分卡模型非常重要,通过第三方数据,可以了解在还款期间借款人是否在其他平台也进行了借贷申请,以及借贷期间用户的消费行为、运营商数据等信息。
借款人真实的逾期情况:如观察期窗口的逾期状态,可以统计不同时间切片下的最大逾期状态、逾期总天数、逾期次数等特征;还可以衡量OA、AB和BC三个阶段最大逾期状态的变化趋势,判断是否有恶化或好转的情况。实际还款率计算:因为产品一般会有最低还款额度,如果借款人当月资金短缺可以按最低额度还款。另外,最低额度借款人都无法偿还或者由于临时忘记还款而导致逾期几天则会有罚息处理,这样每个月的还款压力是不同的。因此,可以用每月的实际还款率衡量借款人的还款情况。实际还款率=本月还款总额/上个月应还总额,如借款人正常还款情况下每个月应还总额为1000,但如果有罚息或执行了最低还款,则下个月的应还总额会增加。当然,可以求时间切片特征,如最大值、最小值及趋势特征等。设备指纹特征:如登录次数、用户操作等信息,以及时间切片特征。2.第三方数据第三方数据往往需要购买才可以得到,其对行为评分卡模型非常重要,通过第三方数据,可以了解在还款期间借款人是否在其他平台也进行了借贷申请,以及借贷期间用户的消费行为、运营商数据等信息。