运维开发网

PSi-Population Stability Index (PSI)模型分稳定性评估指标

运维开发网 https://www.qedev.com 2021-02-19 09:37 出处:51CTO 作者:PythonEducation
PSi-Population Stability Index (PSI)模型分稳定性评估指标

由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。公式如下:

PSi-Population Stability Index (PSI)模型分稳定性评估指标

PSI实际应用范例:

1)样本外测试

  针对不同的样本测试一下模型稳定度,比如训练集与测试集,也能看出模型的训练情况,我理解是看出模型的方差情况。

2)时间外测试

  测试基准日与建模基准日相隔越远,测试样本的风险特征和建模样本的差异可能就越大,因此PSI值通常较高。至此也可以看出模型建的时间太长了,是不是需要重新用新样本建模了。

PSI揭秘拿破仑和希特勒为何俄罗斯失败

PSI揭秘2008年美国华尔街金融危机

独裁者与信用危机

拿破仑和希特勒试图俄罗斯和2007 - 08年的金融危机有何相似之处?

拿破仑试图在1812年俄罗斯,希特勒于1941年重复了拿破仑的不端行为 - 两次都以独裁者军队的严重失败而告终。拿破仑和希特勒的军队远远优于俄罗斯人。正是这场战斗的条件导致了这些失败。俄罗斯的冬天经常对这些军队的命运负责。实际上,正是拿破仑和希特勒的男人们的准备不足和不良判断导致了他们羞辱性的失败。他们是训练有素的人,但他们受过法国和德国的良好条件训练。这一次,战斗处于完全不同的极端条件下,他们无法应对。

2007-08财政危机期间信用风险模型的失败可能与法国和德国军队的命运有关。这些模型是在一个仁慈的经济环境中建立和培训的,并且没有准备好应对当时的极端经济条件。此外,金融公司的高管们做出了一系列糟糕的判断,导致经济全面崩溃。

上述故事的寓意是,必须密切关注当前流行的环境和培训环境中的条件变化。 “巴塞尔协议III”已经非常重视监督投资组合,这是有充分理由的。人口稳定指数(PSI)就是这样一个指数,它可以帮助风险管理人员完成零售信用记分卡的这项任务。

人口稳定指数(PSI) - 我们的银行业案例继续

假设您是银行的首席风险官。 自从您的团队在您的监督下建立了汽车贷款信用记分卡以来已经过去了几年。 从那时起,银行的整体风险评估流程得到了显着改善。 虽然您是一名谨慎的风险经理,但您已经要求您的团队定期比较建立记分卡的人口和现有的门户(汽车贷款申请人)。 开始这种比较的一个好地方是检查两个种群如何在通过记分卡创建的风险区分布。 以下是您的团队针对基准样本进行的最新季度比较的表示。 这里实际%'是最新季度的人口分布,'预期%'是验证样本的人口分布(a.k.a.基准样本)。

PSi-Population Stability Index (PSI)模型分稳定性评估指标

目视比较两个人群是一个很好的起点。 目前的人口似乎已转向图表的右侧。 在很小程度上,这是预期的,因为市场开始对银行的审批策略作出反应,因为记分卡经常影响到门户。 但是,我们需要问的问题是,这是否是人口的重大转变? 基本上,您正在比较两种不同的分布,并且可以使用任何拟合度度量,例如卡方检验。 然而,人口稳定性指数是一个行业认可的指标,为此提供了一些方便的经验法则。 人口稳定性指数(PSI)公式如下所示(参见Naeem Siddiqui的“信用风险记分卡”)

PSi-Population Stability Index (PSI)模型分稳定性评估指标

再次像证据的重量和信息价值,PSI似乎已经成为信息理论的根源。 让我们计算人口的人口稳定性指数(PSI)(我们已经看到了上面的直方图)。

PSi-Population Stability Index (PSI)模型分稳定性评估指标

上表中的最后一列是我们关心的。 让我们考虑分数带251-290并计算该行的索引值。

PSi-Population Stability Index (PSI)模型分稳定性评估指标

PSI的最终值,即0.13,是最后一列的所有值的总和。 现在的问题是如何解释这个值? PSI的经验法则如下所示

PSi-Population Stability Index (PSI)模型分稳定性评估指标

值为0.13属于第二行区间,表示人口与验证或基准样本的微小变化。这些都是方便的规则。但是,必须要问的是,这个人口如何转变会对记分卡产生任何影响?实际上,它可能有也可能没有任何区别。记分卡的每个分数带都有相关的不良率或客户未偿还贷款的概率。例如,我们的记分卡中的分数带251-290具有10%的不良率,或者该分数带中的10个人口中的一个客户将不会为他/她的贷款提供服务。人口稳定指数仅表明贷款申请人口的变化。然而,这可能会或可能不会导致记分卡的性能恶化以预测风险。然而,PSI表明环境的变化需要通过分析银行宏观经济状况和整体贷款政策的变化进一步调查。

备注

PSI人口稳定性指数是检查不断变化的条件的指标之一 - 但是,很明显,人们必须捕捉到强大的指标,以便密切关注不断变化的经济风,以防止崩溃着陆。另一方面,俄罗斯的冬天确实改变了地球的历史 - 我想改变并不总是坏事。

补充解释ln()为自然对数函数

PSi-Population Stability Index (PSI)模型分稳定性评估指标

欢迎各位同学学习更多风控模型知识,《python金融风控评分卡模型和数据分析微专业课》

https://edu.51cto.com/sd/f2e9b

PSi-Population Stability Index (PSI)模型分稳定性评估指标

(微信二维码扫一扫)

扫码领视频副本.gif

0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号