当前位置:主页 > 管理论文 > 信息管理论文 >

基于电信数据的用户内容偏好画像补全

发布时间:2020-07-05 22:30
【摘要】:用户画像对于电信运营商的营销策略决策以及用户体验改进十分重要,其中用户的网络内容偏好是画像的重要组成部分。在目前运营商利用探针(DPI)数据无法完整记录用户内容偏好信息的情况下,如何利用多种电信数据对缺失的用户内容偏好进行补全,建立完整可靠的用户偏好画像是一个有重要意义的研究方向。本文以补全用户内容偏好为研究目标,以多类型电信数据集为基础,提出了结合偏好类别信息的偏好补全模型及结合用户特征信息的偏好补全模型,并对用户内容偏好画像补全模型进行了实现。1、模型设计与实现:本文将偏好补全问题与传统Top-N推荐问题相结合,并以隐因子模型为基础模型,挖掘利用电信多类型数据提出两种算法拓展隐因子模型解决偏好补全问题:(1)结合偏好类别的偏好补全模型:针对数据集中的偏好信息,本文从内容偏好分层类别关系的角度出发,对偏好间关系进行详细地量化定义,并基于此设计结合偏好类别信息的设计偏好补全模型。(2)结合用户特征的偏好补全模型:针对数据集中的用户信息,本文通过挖掘与量化抽象出用户特征,并在实验中选取高质特征集,设计结合用户特征的偏好补全模型。(3)同时,针对传统单机算法不能快速完成大数据量偏好任务的问题,本文基于分布式系统实现了上述偏好补全算法模型,可在短时间内完成海量电信用户的偏好补全任务。2、实验评估与结果分析:通过在运营商提供的连续四个月的电信多类型数据集进行模型对比实验以及高质特征识别,发现通过对电信数据的充分挖掘,本文提出的模型在偏好补全问题上的效果相比基础模型得到了很大提升。除此之外,本文基于模型实验结果对偏好关系和高质特征进行了深入分析。3、系统设计与实现:在以上研究的基础上,本文对电信用户内容偏好画像系统进行了设计与实现。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F626;TP311.13
【图文】:

用户特征,论文,网络特征,数据集


偏好补全效果。本文用于挖掘用户特征信息的电信数据集包括用户宽表逡逑(Servlnfo),用户呼叫详单(CDR)和深度包检测(DPI)数据集。从这些数据逡逑集挖掘量化的电信用户特征可以分为以下四个不同类别,如图1-2所示:1、从逡逑用户宽表数据集中提取的终纟而特征(例如终4而品牌,终端EVDO标识);2、从逡逑用户宽表数据集中提取的个人特征(例如用户性别,用户年龄);3、从用户呼叫逡逑详单数据集提取的呼叫特征(例如呼叫总时间,呼叫总频次);4、从深度包检测逡逑数据集提取的网络特征(例如网络总流量,浏览总频次)。逡逑个人特征逦,^\逦终端特征逡逑m邋ttsi...邋y逦^Y^evdo,品牌...逡逑网络特征入--人通话特征逡逑流量,频次…逦时长

类别,关系类型,不相关,类型


针对第二章中提到的利用类别信息进行T0P-N推荐的研究中对关系没有量逡逑化定义的问题,本文首先将电信偏好类别树中的关系划分为父子关系和兄弟关系,逡逑并按照关系类型和关系强度明确对类别关系进行定义和量化,如图3_2所示。逡逑第一层|逦……逡逑第二层|、包逡逑第三层|女士服装男士服装逦篮辞逦^球逡逑4?费逦/\逦Yi逡逑4逦逦/逦\逡逑第四展邋NBA逦CBA逡逑画逦C3I\逡逑^逦I?兄弟至累逡逑厂继承关系逦厂合作关系逡逑厂类型邋<丨逦厂类型j无关关系逡逑父子关系<逦1邋一无关关系逦兄弟关系邋<逦匕竞争关系逡逑逦I-强度[0,1]逦邋I强度【0,1]逦逡逑■p^i'逦|社交软件1逡逑[类型承

本文编号:2743217

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/sjfx/2743217.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b09bb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com