首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于深度强化学习的虚拟机器人采摘路径避障规划
引用本文:熊俊涛,李中行,陈淑绵,郑镇辉.基于深度强化学习的虚拟机器人采摘路径避障规划[J].农业机械学报,2020,51(S2):1-10.
作者姓名:熊俊涛  李中行  陈淑绵  郑镇辉
作者单位:华南农业大学
基金项目:国家自然科学基金项目(32071912)、广东省自然科学基金项目(2018A030313330)、广州市科技计划项目(202002030423)和国家级大学生创新创业训练计划项目(201910564033)
摘    要:针对采摘机器人在野外作业环境中,面临采摘任务数量多,目标与障碍物位置具有随机性和不确定性等问题,提出一种基于深度强化学习的虚拟机器人采摘路径避障规划方法,实现机器人在大量且不确定任务情况下的快速轨迹规划。根据机器人本体物理结构设定虚拟机器人随机运动策略,通过对比分析不同网络输入观测值的优劣,结合实际采摘行为设置环境观测集合,作为网络的输入;引入人工势场法目标吸引和障碍排斥的思想建立奖惩函数,对虚拟机器人行为进行评价,提高避障成功率;针对人工势场法范围斥力影响最短路径规划的问题,提出了一种方向惩罚避障函数设置方法,将障碍物范围惩罚转换为单一方向惩罚,通过建立虚拟机器人运动碰撞模型,分析碰撞结果选择性给予方向惩罚,进一步优化了规划路径长度,提高采摘效率;在Unity内搭建仿真环境,使用ML-Agents组件建立分布式近端策略优化算法及其与仿真环境的交互通信,对虚拟机器人进行采摘训练。仿真实验结果显示,不同位置障碍物设置情况下虚拟机器人完成采摘任务成功率达96.7%以上。在200次随机采摘实验中,方向惩罚避障函数方法采摘成功率为97.5%,比普通奖励函数方法提高了11个百分点,采摘轨迹规划平均耗时0.64s/次,相较于基于人工势场法奖励函数方法降低了0.45s/次,且在连续变动任务实验中具有更高的适应性和鲁棒性。研究结果表明,本系统能够高效引导虚拟机器人在避开障碍物的前提下快速到达随机采摘点,满足采摘任务要求,为真实机器人采摘路径规划提供理论与技术支撑。

关 键 词:采摘机器人    路径规划    避障    深度强化学习    人工势场法
收稿时间:2020/8/5 0:00:00

Obstacle Avoidance Planning of Virtual Robot Picking Path Based on Deep Reinforcement Learning
XIONG Juntao,LI Zhonghang,CHEN Shumian,ZHENG Zhenhui.Obstacle Avoidance Planning of Virtual Robot Picking Path Based on Deep Reinforcement Learning[J].Transactions of the Chinese Society of Agricultural Machinery,2020,51(S2):1-10.
Authors:XIONG Juntao  LI Zhonghang  CHEN Shumian  ZHENG Zhenhui
Institution:South China Agricultural University
Abstract:
Keywords:picking robot  route planning  obstacle avoidance  deep reinforcement learning  artificial potential field method
点击此处可从《农业机械学报》浏览原始摘要信息
点击此处可从《农业机械学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号