行业标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211195962.8 (22)申请日 2022.09.29 (65)同一申请的已公布的文献号 申请公布号 CN 115290096 A (43)申请公布日 2022.11.04 (73)专利权人 广东技术师范大学 地址 510000 广东省广州市天河区中山大 道西293号 (72)发明人 谭志平 唐宇 黄明浩 黄文轩  邢诗曼 黄华盛 郭琪伟 方明伟  (74)专利代理 机构 北京高航知识产权代理有限 公司 11530 专利代理师 王庞 (51)Int.Cl. G01C 21/20(2006.01)G06F 30/27(2020.01) G06N 20/00(2019.01) G06F 111/04(2020.01) G06F 111/10(2020.01) 审查员 章慧敏 (54)发明名称 一种基于强化学习差分算法的无人机动态 航迹规划方法 (57)摘要 本发明涉及无人机动态 航迹规划技术领域, 且公开了一种基于强化学习差分算法的无人机 动态航迹规划方法, 包括以下步骤: S1: 获取无人 机需要飞行的地势环境; S2: 根据获取的环境数 据、 无人机自身 性能约束, 建立航迹规划模型, 将 环境表示为一个人工势场, 以目标点为中心建立 引力势场, 以障碍物及威胁为中心建立斥力势 场; S3: 在建立航迹规划模型时, 增加定位误差校 正的函数结构体, 根据所述人工势场, 计算出无 人机当前所受合力, 并使无人机在合力作用下前 进; S4: 基于航迹规划模型设计强化学习差分算 法; S5: 将强化学习差分算法进行优化后植入到 无人机智能系统中, 通过基于强化学习差分算法 优化后的算法进行求解, 完成对 无人机的航迹规 划。 权利要求书2页 说明书13页 附图1页 CN 115290096 B 2022.12.20 CN 115290096 B 1.一种基于强化学习差分算法的无人机动态航迹规划方法, 其特征在于, 包括以下步 骤: S1: 获取 无人机需要飞行的地势 环境; S2: 根据获取的环境数据、 无人机自身性能约束, 建立航迹规划模型, 将环境表示为一 个人工势场, 以目标点 为中心建立引力势场, 以障碍物及威胁为中心建立斥力势场; S3: 在建立航迹规划模型时, 增加定位误差校正的函数结构体, 根据所述人工势场, 计 算出无人机当前 所受合力, 并使无 人机在合力作用下 前进; S4: 基于航迹规划模型设计强化学习差分算法; S5: 将强化学习差分算法进行优化后植入到无人机智能系统中, 通过基于强化学习差 分算法优化后的算法进行求 解, 完成对无 人机的航迹规划; 所述S4中强化学习差分进化 算法设计包括以下步骤: S31: 将强化学习和差分进化算法相结合, 采用  Q 学习算法或者深度  Q 学习算法作 为 智能体, 进行智能决策; S32: 采用弥散性度量、 自相 关性粗糙度、 地形信息粗糙度以及适应度云对优化问题进 行分析, 将优化问题适应度地形 特征信息作为强化学习智能体的状态空间; S33: 将差分进化算法控制参数和变异策略的选择作为智能体的动作空间, 同时设计将 种群进化效率作为智能体的奖励; S34: 最终实现智能体通过状态空间获取优化问题局部信息, 根据状态空间信息执行动 作空间相应的操作, 计算执 行相应动作操作后获得的奖励并将其返回给智能体。 2.根据权利要求1所述的一种基于强化学习差分算法的无人机动态航迹规划方法, 其 特征在于, 所述S3中增 加定位误差校正的函数 结构体包括以下步骤: S21: 设置无人机的1个出发点和1个目的地R个水平校正点、 L个垂直校正点组成的无人 机航迹规划区域; S22: 构建包含2+R+L点的无人机航迹规划区域, 无人机在空间飞行过程中需要实时定 位, 其定位误差包括垂 直误差和水平误差, 无人机每飞行1m, 垂 直误差和水平 误差将各增加 δ个专用单位, 并当到达目的点时垂直误差和水平误差均应小于θ个单位, 无人机能够按照 规划航迹飞行; S23: 无人机在飞行过程中需要对定位误差进行校正, 航迹规划区域内存在校正点用于 误差校正, 当无人机到达校正点即能够根据校正点的误差校正类型进行误差校正, 校正垂 直和水平误差的位置根据地形在航迹规划前确定, 当垂直误差、 水平误差均能及时校正, 则 无人机能够按照预定航线飞行, 并通过若干个校正 点进行误差校正后最终到 达目的地。 3.根据权利要求1所述的一种基于强化学习差分算法的无人机动态航迹规划方法, 其 特征在于, 所述S3中合力计算按照下式确定无人机的运动方向: ; 其 中, 表示目标对无人机的吸引力, 是目标的坐 标向量, X是无人机当前位置的坐 标向量; k为系数, 取值为0~1; 表示禁飞区对无人机的排斥力, 采用现有的斥力场函数完成 计 算; 吸引力与排斥力的合力F即是 无人机运动的方向。 4.根据权利要求1所述的一种基于强化学习差分算法的无人机动态航迹规划方法, 其 特征在于, 所述S 5中, 对通过基于强化学习差 分算法优化后的算法进 行求解, 完成对无人机 的航迹规划以及对航迹进行约束条件避障。 5.根据权利要求4所述的一种基于强化学习差分算法的无人机动态航迹规划方法, 其权 利 要 求 书 1/2 页 2 CN 115290096 B 2特征在于, 所述约束条件避障包括以下步骤: S61: 输入无人机初始位置作为当前位置 , m个禁飞区的中心位置, , 以及 该无人机所分配的目标位置G; S62: 取两个变量G1, G2, 分别表示计算过程 中的目标位置以及最终目标位置, 并且初始 化G1=G2=G; 开辟A, B两个存储空间, 并将无人机当前位置 存入A; 初始化迭代次数num= 0; S63: 确定无人机 的运动方向, 设置无人机 的运动步长为L, 使无人机从当前位置 以确 定的运动方向按照运动步长L移动, 以移动后的位置来更新当前位置 , 并且将此时无人机 的位置存 入A中, 迭代次数num= num+1; S64: 判断num>N是否成立, 如成立, 则置num=0并进行步骤S65, 否则返 回步骤S63; 其中 N为预设的迭代总数; S65: 判断当前位置 与G1之间的距离d是否满足d< , 其中 为预设的距离阈值; S66: 判断最后M个存入A的位置点是否都在一个预设的圆形区域内, 如果是, 则表明当 前处于平衡位置或局部最小点, 则进行跳出处 理; 如果不是就继续 步骤S63; S67: 求出A最后存 入的两个点之间的直线表达式; S68: 判断所述直线是否与每个圆形禁飞区相交, 如果不是则返回步骤S63, 否则将A最 后存的位置赋值给G1, 清空A  , 然后进行步骤S6 3; S69: 将A中所有的位置存入B中, 并判断G1是否等于G2, 如果不是, 则令 =G1, G1=G2, 然后进行步骤S6 3; S610: B中所存的位置点即为无 人机的避障航迹 。 6.根据权利要求1所述的一种基于强化学习差分算法的无人机动态航迹规划方法, 其 特征在于, 所述S2中建立 航迹规划模型还 包括以下步骤: S71: 获取目标区域包括 地表地形 数据、 植作物数据的图像数据; S72: 基于所述目标区域的图像数据得到无 人机的初始航线; S73: 基于所述初始航线上的拐点位置提取初始航线的第 一实际地理坐标, 基于地表地 形数据的高程 值调整第一实际地理坐标, 得到第一高程 坐标; S74: 基于第一高程 坐标调整所述初始航线得到地形航线; S75: 将初始航线以预设距离划分区间, 逐点提取每一个区间端点的第二实际地理坐 标; S76: 基于植作物数据调整第二实际地理坐标, 得到第二高程坐标, 基于第二高程坐标 调整所述初始航线得到植作物航线; S77: 基于地形航线及植作物航线建立 航迹规划模型。权 利 要 求 书 2/2 页 3 CN 115290096 B 3

.PDF文档 专利 一种基于强化学习差分算法的无人机动态航迹规划方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于强化学习差分算法的无人机动态航迹规划方法 第 1 页 专利 一种基于强化学习差分算法的无人机动态航迹规划方法 第 2 页 专利 一种基于强化学习差分算法的无人机动态航迹规划方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:05:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。