当前位置:主页 > 管理论文 > 信息管理论文 >

基于电信运营商大数据的用户信用评分卡的设计与实现

发布时间:2020-05-22 13:14
【摘要】:我国征信行业起步较晚,目前个人信用体系存在着数据来源不全面、覆盖人群不广泛、预测效率不高等问题。而电信运营商作为宽带和移动互联网的流量提供者,在业务运营中积累了大量的用户数据,涵盖了生活的方方面面,且可信度非常高,这些海量、稳定、快速增长的数据为运营商进行征信服务提供了得天独厚的条件。另外一方面,随着电信业务规模不断扩大,业务产品不断创新,对于电信用户的个人信用评价成为减少坏账风险,提升业务收入的重要环节。针对这些问题和需求,本文基于电信用户数据进行特征选择与建模,参考金融领域的信用评分机制,构建了电信用户信用评分卡模型。主要工作如下:(1)多维度真实业务数据的预处理。基于电信运营商的真实业务数据,对数据集进行了预处理,提出了一种处理不平衡数据集的融合算法,该算法综合考虑了过采样和欠采样的优缺点,实现了近邻点欠采样和自适应综合过采样这两种算法的融合。经过实验验证,相比传统的不平衡数据集处理方法,融合算法的处理效果更好。(2)提出了一种新框架下的特征选择方法。针对获取的电信用户数据进行探索性分析,根据分析结果对特征进行了单列处理和选择,提出并行寻优的特征选择方法,经过实验验证,在特征比较少的情况下,新方法可以在不降低后续训练模型的性能的前提下保留最多的有用信息。(3)设计构建和实现了基于评分卡形式的信用评估模型。利用常用的机器学习算法构建电信用户信用评估模型并进行实验对比分析,综合考虑预测能力和可解释性选择逻辑回归算法实现电信用户信用评估模型,并创新性地将金融领域的评分卡模型应用到电信领域,实现了从模型到评分卡的转换。(4)设计和实现了具扩展性的信用评分原型系统。结合具体业务场景和需求,设计多个功能模块,方便后续的扩展和业务应用。综上所述,本文经过数据预处理、特征处理等工作,选择了逻辑回归算法构建了电信用户信用评估模型,并将银行客户评分卡模式应用到电信领域,为运营商进行风控和信控提供了可行的思路。
【图文】:

函数,自变量,线性回归模型,取值范围


图 2-1 Logistic 函数Figure 2-1 Logistic function模型是建立ln( )1p p与自变量的线性回归模型,逻示:nln( ) x x x1ppp 的取值范围是 , ,这样,自变量 1, 2,,记ng( ) x x xpx ,得到公式(2( )1( 1| )1g xp P y Xe ( ) ( )1 11 ( 0 | ) 11 1g x xp P ye egX

分类原理


北京工业大学工程硕士专业学位论文2.2.2 SVM 算法SVM 即支持向量机,全称为 Support Vector Machine,属于有监督学习算法的一种[36]。SVM 要解决的问题可以用经典的两类问题来描述。如图 2-2 所示,红色和蓝色的二维数据点被一条直线清楚地分开,在模式识别领域被称为线性可分离问题,但是,显然有两条直线可以将两种数据点分开。图 2-2 中(b)和(c)分别显示了两种不同的分类方案,其中实心黑线是分界线,称为 决策平面 。 每个决策平面对应于线性分类器。尽管两个分类器的分类结果在当前数据中是相同的,但是如果考虑潜在的其他数据,,则两者的分类性能是不同的。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.13;F626

【参考文献】

相关期刊论文 前6条

1 陈一昕;谷静宜;王蕾;朱志勇;刘韵洁;;基于中国联通大数据的个人征信评估方法[J];信息通信技术;2015年06期

2 叶文辉;;大数据征信机构的运作模式及监管对策——以阿里巴巴芝麻信用为例[J];新金融;2015年07期

3 欧阳红兵;李雅琪;;中外征信体系比较研究及启示[J];商业经济研究;2015年07期

4 徐志维;廖健;;基于支持向量机的电信客户信用风险评估模型[J];电脑与电信;2013年08期

5 尤晓明;;个人信用评分系统应用现状与展望[J];中国信用卡;2009年06期

6 李晓宇;张新峰;沈兰荪;;支持向量机(SVM)的研究进展[J];测控技术;2006年05期

相关会议论文 前1条

1 宋光兴;李涛;;信用缺失对我国电子商务发展的影响及对策分析[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年

相关博士学位论文 前2条

1 张万军;基于大数据的个人信用风险评估模型研究[D];对外经济贸易大学;2016年

2 弋涛;信用卡风险管理研究[D];西南财经大学;2006年

相关硕士学位论文 前10条

1 章华;基于电信数据的用户信用评价模型的研究[D];北京邮电大学;2018年

2 杨静;信用评分卡的建立与应用[D];天津商业大学;2018年

3 刘学超;大数据背景下的我国社会信用体系建设研究[D];燕山大学;2018年

4 勾婷婷;BP神经网络和Logistic回归在信用评级上的应用与模型对比[D];重庆大学;2017年

5 倪显情;基于数据挖掘技术的信用评分卡模型[D];苏州大学;2017年

6 王茁宇;基于Logistic模型的P2P网络借贷个人信用评估研究[D];宁波大学;2017年

7 简敏;基于GA-K2算法的贝叶斯网络研究及在个人信用评估的应用[D];暨南大学;2016年

8 黄苛;H运营商基于大数据的通信用户征信研究[D];北京林业大学;2016年

9 毋非非;中美个人信用档案建设和运行机制的比较[D];郑州大学;2013年

10 曹林;基于统计学习的数据预处理缺失值清洗方法研究[D];哈尔滨工程大学;2012年



本文编号:2676049

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/sjfx/2676049.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户49017***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com