基于Huber损失的非负矩阵分解算法在聚类中的研究

发布时间:2022-07-27 13:56
  非负矩阵分解是一种经典的数据分析工具被广泛应用于聚类任务中。它在保证对原始矩阵的良好近似前提下,为原始数据找到非负的、线性的矩阵表示。由于这种方法提取的特征都是非负的,符合现实数据的本质特征,因此被用于处理图像数据、光谱数据、基因表达数据。除了应用领域,非负矩阵分解在科研领域也受到了大量的关注,如今已有众多研究成果出现在视野中。在现有的研究方法和理论基础上,本文进一步分析算法的优点和不足之处,进行了相应的改进。论文的主要工作如下:(1)传统的非负矩阵分解算法使用均方误差函数来度量重建误差,在处理含有较大噪声的数据时模型的拟合效果很容易受到影响。Huber损失函数对较小的残差执行的惩罚与均方误差损失函数相同,对较大的残差执行的惩罚是线性增长的,因此与均方误差损失函数相比,Huber损失函数具有更强的鲁棒性;已有研究证明2,1范数稀疏正则项在机器学习的分类和聚类模型中具有特征选择作用。结合二者优点本文提出了一种基于Huber损失函数且融入2,1范数正则项的非负矩阵分解算法,并给出了基于投影梯度更新规则的优化过程,在多组数据集上将所提算法与多种聚类... 

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 主要研究内容
    1.4 本文组织结构
第二章 论文研究的整体思路与相关知识
    2.1 论文研究的整体思路
    2.2 相关知识
        2.2.1 非负矩阵分解定义及性质
        2.2.2 投影梯度法
第三章 一种基于Huber损失的非负矩阵分解算法
    3.1 模型建立
    3.2 模型求解
        3.2.1 计算W
        3.2.2 计算H
        3.2.3 迭代终止条件
    3.3 时间复杂度分析
    3.4 实验
        3.4.1 评价指标
        3.4.2 对比算法
        3.4.3 合成数据集的聚类结果
        3.4.4 真实数据集的聚类结果
        3.4.5 参数的选择
    3.5 本章小结
第四章 基于Huber损失的自表达非负矩阵分解算法
    4.1 模型建立
    4.2 模型求解
        4.2.1 计算W
        4.2.2 计算H
        4.2.3 迭代终止条件
    4.3 时间复杂度分析
    4.4 实验
        4.4.1 评价指标
        4.4.2 对比算法
        4.4.3 合成数据集的聚类结果
        4.4.4 真实数据集的聚类结果
        4.4.5 参数的选择
    4.5 本章小结
第五章 总结
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式


【参考文献】:
期刊论文
[1]稀疏约束图正则非负矩阵分解[J]. 姜伟,李宏,余震国,杨炳儒.  计算机科学. 2013(01)



本文编号:3665577

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3665577.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户70b70***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com