行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210952157.9 (22)申请日 2022.08.09 (71)申请人 厦门理工学院 地址 361024 福建省厦门市集美区理工路 600号 (72)发明人 张国伟 孔洋洋 王力 刘智超  (74)专利代理 机构 哈尔滨龙 科专利代理有限公 司 23206 专利代理师 李智慧 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/25(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 10/08(2012.01) (54)发明名称 一种轻量 化的物流包裹目标检测模型 (57)摘要 本发明公开了一种轻量化的物流包裹目标 检测模型, 所述模型由input模块、 backbone模 块、 neck模块和prediction模块四部分构成, 其 中: input模块是图像 数据的输入端, 用于将物流 运输线上采 集的尺寸为752 ×480的3通道图像数 据处理成640 ×640×3的图像数据; backbone模 块用于提取input模块输 出的图像数据的物流包 裹特征; neck模 块用于对backbone模块提取的物 流包裹特征进行混合和组合; p rediction模 块用 于处理neck模块获取的 图像特征, 并对目标类别 和边界框进行预测并输出。 本发 明能够满足真实 工作环境下的实时性、 准确性、 轻量化容易部署 等要求。 权利要求书2页 说明书6页 附图4页 CN 115375937 A 2022.11.22 CN 115375937 A 1.一种轻量化的物流包裹目标检测模型, 其特征在于所述模型由input模块、 backbone 模块、 neck模块和predicti on模块四部分构成, 其中: 所述input模块是图像数据的输入端, 用于将物流运输线上采集的尺寸为752 ×480的3 通道图像数据处 理成640×640×3的图像数据; 所述backbo ne模块用于提取i nput模块输出的图像数据的物流包裹特 征; 所述neck模块用于对backbo ne模块提取的物流包裹特 征进行混合和组合; 所述prediction模块用于处理neck模块获取的图像特征, 并对目标类别和边界框进行 预测并输出。 2.根据权利要求1所述的轻量化的物流包裹目标检测模型, 其特征在于所述backbone 模块由第0层~第6层构成, neck模块由第7层~第18层构成, 第15层和第18层分别作为 predicti on模块的中目标检测层和大目标检测层; 所述第0层为CBRM层, input模块输出的640 ×640×3图像数据作为第0层的输入, 第0层 输出的16 0×160×8图像数据作为第1层的输入; 所述第1层 为Shuffle ‑Block层, 步长s=2, 第1层的输入图像数据大小为160 ×160×8, 第1层输出的80 ×80×64图像数据作为第2层的输入; 所述第2层为C3 ‑Lite层, 使用了3个Bottleneck结构, C3 ‑Lite层的步长s=1, 第2层的 输入图像数据大小为80 ×80×64, 第2层输出的80 ×80×64图像数据同时作为第3层和第13 层的输入; 所述第3层为Shuffle ‑Block层, 步长s=2, 第3层输入的图像数据大小为80 ×80×64, 第3层输出的40 ×40×128图像数据作为第4层的输入; 所述第4层为C3 ‑Lite层, 使用了7个Bottleneck结构, C3 ‑Lite层的步长s=1, 第4层的 输入图像数据大小为40 ×40×128, 第4层输出的40 ×40×128图像数据同时作为第5层和第 9层的输入; 所述第5层 为Shuffle ‑Block层, 步长s=2, 第5层的输入图像数据大小为40 ×40×128, 第5层输出的20 ×20×256图像数据作为第6层的输入; 所述第6层为C3 ‑Lite层, 使用了3个Bottleneck结构, C3 ‑Lite层的步长s=1, 第6层的 输入图像数据大小为20 ×20×256, 第6层输出的20 ×20×256图像数据作为第7层的输入; 所述第7层为Conv层, 第7层的输入图像数据大小为20 ×20×256, 第7层输出的20 ×20 ×128图像数据同时作为第8层和第17层的输入; 所述第8层为上采样, 第8层的输入图像数据大小为20 ×20×128, 第8层输出的40 ×40 ×128图像数据作为第9层的输入; 所述第9层为Concat层, 第9层的输入图像大小为40 ×40×128+40×40×128, 第9层输 出的40×40×256图像数据作为第10层的输入; 所述第10层为C3层, 第10层的输入图像大小为40 ×40×256, 第10层输出的40 ×40× 128图像数据作为第1 1层输入; 所述第11层为Conv层, 第11层的输入图像大小为40 ×40×128, 第11层输出的40 ×40× 64图像数据作为第12层的输入; 所述第12层为上采样层, 第12层的输入图像大小为40 ×40×64, 第12层输出的80 ×80 ×64图像数据作为第13层的输入;权 利 要 求 书 1/2 页 2 CN 115375937 A 2所述第13层 为Concat层, 第13层的输入图像大小为80 ×80×64+80×80×64, 第13层输 出的80×80×128图像数据作为第14层的输入; 所述第14层为Focus层, 第14层的输入图像大小为80 ×80×128, 第14层输出的40 ×40 ×128图像数据作为第15层的输入; 所述第15层为C3层, 第15层的输入图像大小为40 ×40×128, 第15层输出的40 ×40×64 图像数据作为第16层的输入, 第15层即为predicti on模块的中目标检测层; 所述第16层为Focus层, 第16层的输入图像大小为40 ×40×64, 第16层输出的20 ×20× 64图像数据作为第17层的输入; 所述第17层为Concat层, 第17层的输入图像大小为20 ×20×64+20×20×128, 第17层 输出的20 ×20×192图像数据作为第18层的输入; 所述第18层为C3层, 第18层的输入图像大小为20 ×20×192, 第18层输出为20 ×20× 64, 第18层即为predicti on模块的大目标检测层。 3.根据权利要求1所述的轻量化的物流包裹目标检测模型, 其特征在于所述Shuffle ‑ Block由分支1、 分支2和Channel  Shuffle构成, 其中: 分支1和分支2的通道数与输入的特征 通道数相同, 分支1通过3*3/2的DWConv、 1*1Conv进行处理; 分支2通过1*1Conv、 3*3/2的 DWConv、 1*1Conv进行处理; 分支1和分支2经过Concat处理后即按照通道数相加, 图像数据 的长宽都减半, 通道数翻倍, Co ncat的输出作为C hannel Shuffle的输入。 4.根据权利 要求2所述的轻量化的物流包裹目标检测模型, 其特征在于所述C3 ‑Lite层 由分支1、 分支2构成, 特征图输入分支1经过1*1的DWConv卷积操作降维后, 再经过 Bottleneck叠加的操作, 维度不变, 得到的特征图与 分支2经过1*1 的DWconv卷积操作降维 得到的特 征图进行Co ncat操作, 最后再 经过1*1的CBS标准卷积 操作最终输出。 5.根据权利要求4所述的轻量化的物流包裹目标检测模型, 其特征在于所述 Bottleneck由分支a和分支b构成, 其中: 分支b 不进行任何处理, 分支a先是使用1*1的标准 卷积进行降维, 后使用3 *3的标准卷积升维, 再和分支b进行Ad d操作, 维度不变。权 利 要 求 书 2/2 页 3 CN 115375937 A 3

.PDF文档 专利 一种轻量化的物流包裹目标检测模型

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种轻量化的物流包裹目标检测模型 第 1 页 专利 一种轻量化的物流包裹目标检测模型 第 2 页 专利 一种轻量化的物流包裹目标检测模型 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:24:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。