当前位置:主页 > 社科论文 > 军事论文 >

基于经验移植的自主空战对抗学习方法

发布时间:2024-01-21 08:04
  现有的机器学习方法大多是交互式的学习模式,这类方法在训练过程非常依赖与环境之间的交互数据。空战对抗任务是一种奖励非常稀疏的训练任务,智能体在学习开始的很长一段时间内,都在探索能够获得奖励的动作。如果每一个新的任务都重新训练,是非常浪费计算资源的。因此,设计了一种基于经验移植的学习方法,使得经过训练的智能体能够将知识分享给新的智能体,提高其在新任务上的学习效率。首先,借鉴人类通过经验进行快速学习的现象,构建了基于经验移植的学习的模型;其次,兼顾知识分享和新任务的特征,明确了经验的内涵,建立了"知识+任务→经验"的融合认知方式;再次,设计了借鉴学习方法,将外部经验与任务相结合,进而转化为新个体的知识;最后,使用经验适用度作为筛选指标,分析了经验适用度对借鉴学习效率的影响,确定了执行借鉴学习的筛选边界。新个体通过借鉴学习后能够获得关于新任务的初步知识,在新任务中更快地找到能够获得奖励的动作策略,从而提升在新的任务中的学习速度。

【文章页数】:9 页

基于经验移植的自主空战对抗学习方法


基于经验移植的自主空战对抗学习方法


基于经验移植的自主空战对抗学习方法



本文编号:3881546

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/renwuzj/3881546.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户f5ca0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com