(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210787509.X
(22)申请日 2022.07.06
(71)申请人 燕山大学
地址 066004 河北省秦皇岛市河北 大街西
段438号
(72)发明人 郭柏苍 许新亮 金立生 李小特
张舜然 姚航
(74)专利代理 机构 北京市诚辉律师事务所
11430
专利代理师 成丹 耿慧敏
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)G06V 10/762(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种目标检测方法、 装置、 电子设备及存储
介质
(57)摘要
本申请提供一种目标检测方法、 装置、 电子
设备及存储介质, 该方法包括: 获取路侧的多目
标图像; 多目标图像输入M3 ‑YOLOv4检测模型, 输
出目标检测结果; 其中, M3 ‑YOLOv4检测模型包 括
骨干网络MobileNetV 3、 空间金字塔池化、 路径聚
合网络及检测头。 该方案可以解决现有目标检测
时效性差的问题。
权利要求书1页 说明书10页 附图4页
CN 115147654 A
2022.10.04
CN 115147654 A
1.一种目标检测方法, 其特 征在于, 所述方法包括:
获取路侧的多目标图像;
所述多目标图像输入M3 ‑YOLOv4检测模型, 输出目标检测结果; 其中, 所述M3 ‑YOLOv4检
测模型包括骨干网络 MobileNetV3、 空间金字塔池化、 路径聚合网络及检测头 。
2.根据权利要求1所述的方法, 其特征在于, 所述多目标图像输入M3 ‑YOLOv4检测模型,
输出目标检测结果, 包括:
采用所述骨干网络MobileNetV3对所述多目标图像进行卷积并提取车辆目标特征信
息, 得到第一特 征图;
采用所述空间金字塔池化对所述第一特 征图进行处 理, 得到第二特 征图;
采用所述路径聚合网络对所述第二特 征图进行反复提取, 得到第三特 征图;
采用所述检测头对所述第 三特征图进行目标位置与类别信 息的回归处理, 对输出信 息
进行解码, 得到所述目标检测结果。
3.根据权利要求1所述的方法, 其特征在于, 所述M3 ‑YOLOv4检测模型训练阶段和测试
阶段的数据集包括公开数据集和试验路段进行路侧视角下采集的多目标图像集。
4.根据权利要求1所述的方法, 其特征在于, 所述M3 ‑YOLOv4检测模型训练阶段采用随
机梯度下降方法进行 所述M3‑YOLOv4检测模型的参数 更新。
5.根据权利要求1所述的方法, 其特征在于, 所述M3 ‑YOLOv4检测模型训练阶段网络训
练总损失函数包括置信度损失函数、 类别损失函数和定位损失函数。
6.根据权利要求5所述的方法, 其特 征在于, 所述总损失函数L(o,c,O,C,l,g)为:
L(o,c,O,C,l,g)= λ1Lconf(o,c)+λ2Lcls(O,C)+λ3Lloc(l,g)
其中, Lconf(o,c)为置信度损失函数, Lcls(O,C)为类别损失函数, Lloc(l,g)为定位损失函
数, λ1, λ2, λ3为平衡系数。
7.根据权利要求1所述的方法, 其特征在于, 所述M3 ‑YOLOv4检测模型的预设锚框的尺
寸采用K均值聚类方法确定 。
8.一种目标检测装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取路侧的多目标图像;
输出模块, 用于多目标图像输入M3 ‑YOLOv4检测模型, 输出目标检测结果; 其中, 所述
M3‑YOLOv4检测模型包括骨干网络 MobileNetV3、 空间金字塔池化、 路径聚合网络及检测头 。
9.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7中任一所述的目标检
测方法。
10.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时
实现如权利要求1 ‑7中任一所述的目标检测方法。权 利 要 求 书 1/1 页
2
CN 115147654 A
2一种目标 检测方法、 装置、 电子设备及存储介质
技术领域
[0001]本发明属于计算机视觉和智能交通技术领域, 特别涉及一种目标检测方法、 装置、
电子设备及存 储介质。
背景技术
[0002]得益于新一代互联网和先进的无线通信技术飞速发展, 为保障自动驾驶车辆在网
联应用场景下的交通安全, 提高通行效率, 推进自动驾驶真正走向成熟, 全方位 实现车‑车、
车‑路等动态实时信息交互的车路协同自动驾驶产业创新体系, 已成为抢占新一轮科技创
新和产业 竞争制高点的有力手段。
[0003]相较于广为关注的车载视角为主的自动驾驶信息采集存在的诸如感知 能力与视
距有限、 车载端传感器组成方案成本高昂、 系统内各感知模块间产生信息复杂冗余等问题,
路侧感知系统作为智能交通系统中关键组成部分, 已成为重要的研究热点。 路侧感知系统
通过将多源异构传感器安装于路侧高处, 有效减少感知视野盲区; 减轻自动驾驶车辆感知
系统负担; 提高道路利用率, 发挥道路与车辆协同优势。 路侧感知系统通常可基于视觉感知
信息、 雷达点云数据或多模态融合数据完成感知任务。 视觉传感器因其成本较雷达传感器
低廉, 能够准确表达目标纹 理特征的特点, 在感知任务中扮演重要角色。
[0004]在视觉感知领域中, 如何将各类交通参与者的检测任务完成于路侧较低算力的边
缘计算平台已成为为自动驾驶赋能的必要手段。 由于视觉传感器其成像分辨率提升, 路侧
感知系统中感知单元所传递给计算单元的视频资源将呈指数式增长, 如 若采用人力对此类
信息进行手工处理, 所需的人力成本与时间成本将无法估量。 因此, 如何利用科学高效的理
论方法与应用手段完成 感知任务已成为亟需研究的主题。
发明内容
[0005]本说明书实施例的目的是提供一种目标检测方法、 装置、 电子设备及存储介质, 以
解决现有目标检测时效性差的问题。
[0006]为解决上述 技术问题, 本申请实施例通过以下 方式实现的:
[0007]第一方面, 本申请提供一种目标检测方法, 该 方法包括:
[0008]获取路侧的多目标图像;
[0009]多目标图像输入M3 ‑YOLOv4检测模型, 输出目标检测结果; 其中, M3 ‑YOLOv4检测模
型包括骨干网络 MobileNetV3、 空间金字塔池化、 路径聚合网络及检测头 。
[0010]在其中一个实施例中, 多目标图像输入M3 ‑YOLOv4检测模型, 输出目标检测结果,
包括:
[0011]采用骨干网络MobileNetV3对多目标图像进行卷积并提取车辆目标特征信息, 得
到第一特 征图;
[0012]采用空间金字塔池化对第一特 征图进行处 理, 得到第二特 征图;
[0013]采用路径聚合网络对第二特 征图进行反复提取, 得到第三特 征图;说 明 书 1/10 页
3
CN 115147654 A
3
专利 一种目标检测方法、装置、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:56:28上传分享