基于流形学习的强化学习算法研究

发布时间：2024-01-29 06:53

　　如何表示数据和怎样自动发现options是强化学习面临的两个巨大挑战。近年来分层强化学习在解决“维数灾难”问题方面取得了显著进展,其主要思想是将任务层次分解为子任务,从而加速智能体的学习和规划过程。目前的层次化分解方法基本都是根据先验知识预先设计好的,并不是自动生成的。特别是在动态变化的复杂领域,单凭先验知识预先设计层次结构,在实际应用中很难实现。子任务的自动发现问题已经成为分层强化学习研究领域的热点。流形学习作为一种重要的特征表示和降维技术,在模式识别中得到了广泛的研究。特征表示不仅对模式识别至关重要,而且对解决具有大规模或连续状态空间的序列决策问题也至关重要。因此,对于强化学习算法,非常有必要研究各种具有不同属性的特征学习方法,从而使其在不同的情况下获得更好的性能。为此,针对目前options发现方法中仍然存在的一些问题与不足,本文主要从策略构建方面和options的构造方面展开研究,提出相应的改进算法。主要研究工作如下:第一,针对options发现问题,本文提出了一种基于拉普拉斯特征映射的options自动发现算法。该算法通过PVFs间接定义options来解决options自动...

【文章页数】：87 页

【学位级别】：硕士

图9面上基金资助率随申请人年龄的分布

图1-1论文组织结构

图2-1强化学习模型

图2-2强化学习四要素

本文编号：3887880

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/lindaojc/3887880.html

上一篇：领导者防避下级弄权的因应之策
下一篇：重庆市J区处级领导班子决策规范化研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|