基于深度强化学习的虚拟机器人采摘路径避障规划

发布时间：2022-12-08 03:17

　　针对采摘机器人在野外作业环境中,面临采摘任务数量多,目标与障碍物位置具有随机性和不确定性等问题,提出一种基于深度强化学习的虚拟机器人采摘路径避障规划方法,实现机器人在大量且不确定任务情况下的快速轨迹规划。根据机器人本体物理结构设定虚拟机器人随机运动策略,通过对比分析不同网络输入观测值的优劣,结合实际采摘行为设置环境观测集合,作为网络的输入;引入人工势场法目标吸引和障碍排斥的思想建立奖惩函数,对虚拟机器人行为进行评价,提高避障成功率;针对人工势场法范围斥力影响最短路径规划的问题,提出了一种方向惩罚避障函数设置方法,将障碍物范围惩罚转换为单一方向惩罚,通过建立虚拟机器人运动碰撞模型,分析碰撞结果选择性给予方向惩罚,进一步优化了规划路径长度,提高采摘效率;在Unity内搭建仿真环境,使用ML-Agents组件建立分布式近端策略优化算法及其与仿真环境的交互通信,对虚拟机器人进行采摘训练。仿真实验结果显示,不同位置障碍物设置情况下虚拟机器人完成采摘任务成功率达96.7%以上。在200次随机采摘实验中,方向惩罚避障函数方法采摘成功率为97.5%,比普通奖励函数方法提高了11个百分点,采摘轨迹规划平...

【文章页数】：10 页

【部分图文】：

机器人整体结构示意图

基于深度强化学习的虚拟机器人采摘路径避障规划

0 不同奖励函数下成功采摘个数变化曲线

基于深度强化学习的虚拟机器人采摘路径避障规划

1 路径规划结果

【参考文献】：
期刊论文
[1]基于改进YOLO v3网络的夜间环境柑橘识别方法[J]. 熊俊涛,郑镇辉,梁嘉恩,钟灼,刘柏林,孙宝霞.  农业机械学报. 2020(04)
[2]基于强化学习的DASH自适应码率决策算法研究[J]. 冯苏柳,姜秀华.  中国传媒大学学报(自然科学版). 2020(02)
[3]基于改进人工势场法的双机械臂避障路径规划[J]. 薛阳,俞志程,吴海东,张宁,孙越.  机械传动. 2020(03)
[4]基于深度强化学习的固体放射性废物抓取方法研究[J]. 周祺杰,刘满禄,李新茂,张华.  计算机应用研究. 2020(11)
[5]果园采摘机械手研究现状综述[J]. 王甲甲,程志强,张伏,王俊.  农机化研究. 2020(05)
[6]六自由度采摘机械臂采摘姿态规划研究[J]. 王毅,滕举元,张哲,许洪斌.  机械设计与制造. 2019(08)
[7]基于构型空间先验知识引导点的柑橘采摘机械臂运动规划[J]. 马冀桐,王毅,何宇,王恺,张艺谭.  农业工程学报. 2019(08)
[8]基于深度卷积神经网络的柑橘目标识别方法[J]. 毕松,高峰,陈俊文,张潞.  农业机械学报. 2019(05)
[9]面向轨迹规划的深度强化学习奖励函数设计[J]. 李跃,邵振洲,赵振东,施智平,关永.  计算机工程与应用. 2020(02)
[10]基于碰撞锥改进人工势场的无人机避障路径规划[J]. 熊超,解武杰,董文瀚.  计算机工程. 2018(09)

本文编号：3713438

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/nykjlw/nygclw/3713438.html

上一篇：水果采摘器的设计与运动学分析
下一篇：圆形秸秆捆装载机抓斗机构的设计