基于专家的特征选择及缺省多标记学习策略

发布时间:2023-06-02 03:17
  多标记学习是机器学习中的一个研究热点,在个性化推荐、文本分类、生物学等领域引起了广泛关注。较之传统的单标记学习中的一个实例只能局限于单个标记,对于多标记学习,每个实例可以同时具有多个标记。多标记学习的目的是得到一个高性能的分类模型,它可以对于任何新实例预测出其可能的标记集。在多标记学习问题中,对于特征空间,由于海量数据中维度过高等问题,经常发生维数灾难,从而导致分类精度的降低。然而,可通过特征选择方法实现特征空间的降维,进而提升分类精度和泛化性能。对于标记空间,由于数据获取中其方法和成本限制等原因,部分数据丢失等现象经常出现,从而导致标记的部分缺省。基于此,本文针对这两个问题提出两种处理算法,主要内容如下:(1)对于特征空间的维度过高的问题,多数特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法运行时间较长,复杂度较高。实际上,在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息,必将减少特征选择计算时间,甚至提升分类器性能。基于此,提出一种基于专家特征的条件互信息多标记特征选择算法。该...

【文章页数】:54 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景和现状
    1.2 论文内容及组织结构
        1.2.1 本文的研究内容
        1.2.2 全文的组织结构安排
    1.3 本章总结
第二章 多标记学习框架及相关知识
    2.1 多标记学习
        2.1.1 多标记学习框架
        2.1.2 多标记学习评价指标
    2.2 特征选择
    2.3 互信息
    2.4 多标记核极限学习机
    2.5 本章小结
第三章 基于专家特征的多标记特征选择
    3.1 概述
    3.2 基于专家特征的条件互信息计算模型
    3.3 实验结果和分析
        3.3.1 实验数据与环境描述
        3.3.2 算法选择与相关参数设置
        3.3.3 实验结果和分析
    3.4 本章小结
第四章 基于二级自编码器的非平衡化缺省多标记学习
    4.1 概述
    4.2 二级自编码器的多标记缺损补全
        4.2.1 联合分类间隔面的非平衡化标记补全算法
        4.2.2 二级自编码核极限学习机多标记算法
    4.3 实验设置
        4.3.1 实验数据集描述
        4.3.2 算法选择与相关参数设置
    4.4 实验结果和分析
        4.4.1 全标记实验结果及分析
        4.4.2 缺省标记实验结果及分析
    4.5 本章小结
第五章 电信套餐推荐中的应用
    5.1 概述
    5.2 数据预处理和特征选择
    5.3 应用实现
    5.4 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 下一步工作展望
致谢
参考文献
附录:读研期间科研情况



本文编号:3827558

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3827558.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户a4895***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]