Skip to content

CuiNing6/2018-xinwang

Repository files navigation

2018-新网银行杯Top1方案

比赛链接:http://www.dcjingsai.com/common/cmpt/西南财经大学“新网银行杯”数据科学竞赛_竞赛信息.html

队伍名称:摸金校尉

解决方案:

基于集成学习的信用风险预测模型

本次比赛通过机器学习和数据挖掘技术定量分析信用风险,给出每个样本的预测结果。首先,研究了违约客户和履约客户这两批客户的特征,其次,将机器学习领域比较流行的集成学习模型应用于信用风险评估领域,并利用主流的模型性能评价指标评价模型。在比赛中,对类别型数据进行哑编码,并搭建自编码网络提取特征,利用特征相关性,特征重要性,information value三个方法筛选特征,最后,选取基于加权平均法的集成学习模型和类别分布不平衡环境下基于加权平均法的半监督集成模型对数据进行建模,并使用AUC作为模型性能的具体评价指标,通过两种参数调节方法优化模型。在测试数据集上应用,竞赛结果验证了所构建的集成系统泛化能力较强,模型复杂度适中。

基于加权平均法的集成学习模型示意图:

基于加权平均法的集成学习模型

基于加权平均法的半监督集成学习模型示意图:

基于加权平均法的集成学习模型

代码说明:

  • 模型一对应基于加权平均法的集成学习模型
  • 模型二对应基于加权平均法的半监督集成学习模型
  • 其他代码里存放了比赛过程中的一些尝试,但是最终没有用到,包括自编码网络提取特征,多模态集成和woe特征构建等等。

About

新网银行杯Top1方案

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published