当前位置:主页 > 科技论文 > 软件论文 >

面向差分隐私保护的频繁项集挖掘算法研究

发布时间:2024-03-03 11:32
  近年来,随着数据挖掘、机器学习、深度学习等技术的兴起与发展,企业从普通用户处收集到了大量的数据,并对这些数据进行分析处理来了解用户的习惯和喜好,从而向用户提供更加个性化的服务。但是用户在日常生活中产生的数据包含了大量的个人敏感信息,直接发布或者进行分析会使得不法分子收集到用户的隐私,从而对个人进行网络诈骗、电话诈骗、木马攻击等等。作为一种有着严格数学理论证明的隐私保护机制,差分隐私假设攻击者拥有最大背景知识,在算法每一步的执行过程中添加精心设计的噪声使得最终的输出结果能够保护用户的隐私,而且可以通过调整隐私预算的大小来调整隐私保护级别。目前,差分隐私已经应用于数据挖掘的许多领域,例如主成分分析,聚类,频繁模式挖掘等等。差分隐私直接对数据添加噪声来达到隐私保护的目的,添加噪声的大小与数据集的维度密切相关,直接影响频繁项集挖掘结果的可用性,因此如何兼顾安全性和效用性是差分隐私算法面临的一大挑战。论文从提高挖掘结果的可用性及提高算法效率两个出发点,提出了两种新的满足差分隐私保护的频繁项集挖掘算法。论文对现有的一些频繁项集挖掘算法进行了研究和分析,发现降低数据集中最长事务的长度是提高频繁项集挖...

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

图4.2:各个步骤消耗的时间将各步骤消耗时间占比用饼状图表示出来,观察发现步骤(7)耗时最多,其次是步骤

图4.2:各个步骤消耗的时间将各步骤消耗时间占比用饼状图表示出来,观察发现步骤(7)耗时最多,其次是步骤

南京邮电大学硕士研究生学位论文第四章SampleTrun算法372(1)()2ninini(4.5)证明:搜寻最优集合B是通过遍历集合B,寻找,ijBBB,合并,ijBB后的集合为"B,若使用B"对候选项集进行加噪产生的误差和小于E,则用"B取代B并且更新误差之和E的值。第一次合....


图5.5不同数据集下变化时时间的变化

图5.5不同数据集下变化时时间的变化

南京邮电大学硕士研究生学位论文第五章实验结果与分析51法的平均消耗时间为531.3秒,PS算法的平均消耗时间为647.4秒,DA算法的平均消耗时间为276.2秒。可以看出,比起之间的两个数据集,四个算法的时间消耗都增加了很多,但时间消耗最少的仍为ST算法,时间消耗最多的是PS算法....



本文编号:3917721

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3917721.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户97d5c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com