国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211144028.3 (22)申请日 2022.09.20 (71)申请人 海信电子科技(武汉)有限公司 地址 430073 湖北省武汉市东湖新 技术开 发区软件园东路1号软件产业4.1期B2 栋13层02号-2 (72)发明人 唐敏  (74)专利代理 机构 北京弘权知识产权代理有限 公司 11363 专利代理师 逯长明 孙亚芹 (51)Int.Cl. G06V 10/46(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/80(2022.01)G06V 10/82(2022.01) (54)发明名称 一种图像 显著目标检测方法 (57)摘要 本申请提供一种图像显著目标检测方法, 构 建基于轻量mobilenetv2骨干网络 的检测模型, 并在该骨干网络中引入融合侧连接, 将骨干网络 各层级的特征逐步融合, 并在 多个尺度上预测显 著目标并进行监督学习, 有效避免了过拟合。 申 请的图像显著目标检测方法构建的检测模型轻 量, 同时, 通过引入融合侧连接, 将各层级特征进 行充分融合, 使得该检测模型性能与现有的较大 模型相当。 本申请的图像显著目标检测方法中构 建的检测模型轻量、 且性能较好, 适合电视终端 部署, 可应用于视觉目标跟踪和 智能画质设置等 电视应用场景。 权利要求书1页 说明书8页 附图4页 CN 115512135 A 2022.12.23 CN 115512135 A 1.一种图像显著目标检测方法, 其特 征在于, 包括: 构建“编码‑解码”型卷积神经网络模型, 其中, 所述 “编码”部分采用轻量mobilenetv2 骨干网络, 所述 “编码”部分用于对输入图片进 行特征提取, 生 成一组特征图, 包含高层级到 低层级的特 征图, 各层级的特 征图具有不同尺度的语义信息; 在所述“解码”部分引入数个融合侧连接, 按照从高层到低层的顺序, 各层级融合侧连 接将对应层级的特征图与上一层级的特征图进行特征融合, 并利用融合后的特征图, 获取 预测显著图以及计算损失函数; 利用各层级的损失函数进行训练, 得到训练后的 “编码‑解码”型卷积神经网络模型; 将图像数据输入训练后的 “编码‑解码”型卷积神经网络模型进行图像显著目标检测。 2.根据权利要求1所述的图像显著目标检测方法, 其特征在于, 在轻量mobilenetv2骨 干网络中引入数个细节侧连接, 所述细节侧连接用于在多个层级上 预测显著目标边 缘。 3.根据权利要求2所述的图像显著目标检测方法, 其特征在于, 每个所述细节侧连接包 括细节头模块与细节损失计算模块, 各层级特征图经过细节头模块, 得到对应层级的显著 目标边沿预测, 并与真实显著图在不同尺度下的边沿计算细节损失函数。 4.根据权利要求1所述的图像显著目标检测方法, 其特征在于, mobilenetv2骨干网络 的轻量化过程为: 在mobilenetv2网络中, 去掉最后面的一个卷积层、 一个自适应平均池化 层和一个全连接层, 得到轻量mobi lenetv2骨干网络 。 5.根据权利要求1所述的图像显著目标检测方法, 其特征在于, 所述每个融合侧连接包 括特征融合模块、 分割头模块以及自动损失计算模块, 相邻融合侧连接的特征融合模块之 间设置拼接模块, 对应层级的特 征图与上一层级的融合特 征图通过 所述拼接模块进行 特征拼接; 拼接后的特征图进入所述特征融合模块进行特征融合处理, 得到对应层级的融合特征 图; 所述融合特 征图输入所述分割头模块, 经语义分割, 得到对应层级的预测显著图; 根据所述预测显著图与真实显著图, 计算各层级对应的损失函数。 6.根据权利要求5所述的图像显著目标检测方法, 其特征在于, 所述拼接后的特征图进 入所述特 征融合模块进行 特征融合处 理, 得到对应层级的融合特 征图,包括, 拼接后的特 征图经过卷积层、 批量归一 化层、 激活层三层处 理后, 分成三个分支, 其中, 第一分支为残差结构中的直连分支; 第二分支经过1x1卷积层后再分成三个子分支, 分别对应着膨胀系数为1、 2、 3的空洞卷 积, 经过空洞卷积后得到的3个子 分支输出相加, 经过批量归一化层和激活层, 再通过1x1卷 积层后与第一子 分支相加, 第一子 分支与第二子 分支一起形成一个残差结构, 再经过1x1卷 积实现融合, 该融合输出将与第三子分支再次融合; 第三分支依次经过全局池化层、 1x1卷积层、 激活层、 1x1卷积层和sigmoid层后得到权 重系数, 该权 重系数与第一第二分支融合输出的结果对应相乘, 得到最后的特 征融合输出。 7.根据权利要求5所述的图像显著目标检测方法, 其特征在于, 所述分割头模块包括输 出通道数为1的1х1卷积层和Sigmo id激活层。权 利 要 求 书 1/1 页 2 CN 115512135 A 2一种图像显著目标 检测方法 技术领域 [0001]本申请涉及图像处 理技术领域, 尤其涉及一种图像显著目标检测方法。 背景技术 [0002]显著目标检测是模拟人类视觉 的聚焦效应来检测图像中显著目标的区域。 目前, 显著目标检测已在图像检索、 视觉目标跟踪、 场景分类、 基于内容的视频压缩和弱监督学习 中有着广泛的应用。 [0003]目前, 常用的显著目标检测方法均是基于深度学习的全卷积网络。 卷积网络 的骨 干网络由若干个卷积模块堆叠组成, 靠近输入的模块被称为低层, 远离输入的模块被成为 高层, 其中, 神经网络的高层包含语义相关的信息, 神经网络的底层包含更多的细节信息。 在显著目标检测过程中, 通过融合不同层级(包括高层级与低层级)的特征, 可有效提高显 著检测的结果。 [0004]但是, 现有的基于深度全卷积网络 的显著目标检模型中, 高层特征和低层特征的 融合方法较为复杂, 造成计算开销大。 另外, 目前的显著目标检测模型采用大骨干网络, 资 源消耗大, 在小型设备终端难以部署。 发明内容 [0005]本申请提供了一种图像显著目标检测方法, 以解决现有的图像显著目标检测采用 大骨干网络, 并且采用的特征融合方法较为复杂, 造成检测模型的计算开销大、 资源消耗 大, 从而不 易在小型设备终端部署的问题。 [0006]本申请提供了一种图像显著目标检测方法, 包括: [0007]构建“编码‑解码”型卷积神经网络模型, 其中, 所述 “编码”部分采用轻量 mobilenetv2骨干网络, 所述 “编码”部分用于对输入图片进行特征提取, 生成一组特征图, 包含高层级到低层级的特 征图, 各层级的特 征图具有不同尺度的语义信息; [0008]在所述“解码”部分引入数个融合侧连接, 按照从高层到低层的顺序, 各层级融合 侧连接将对应层级的特征图与上一层级的特征图进行特征融合, 并利用融合后的特征图, 获取预测显著图以及计算损失函数; [0009]利用各层级的损失函数进行训练, 得到训练后的 “编码‑解码”型卷积神经网络模 型; [0010]将图像数据输入训练后的 “编码‑解码”型卷积神经网络模型进行图像显著目标检 测。 [0011]本申请提供一种图像显著目标检测方法, 构建基于轻量mobilenetv2骨干网络的 显著目标检测模型, 并在该骨干网络中引入融合侧连接, 将骨干网络各层级的特征逐步融 合, 并在多个尺度上 预测显著目标并进行监 督学习, 有效避免了过拟合。 [0012]申请的图像显著目标检测方法构建的检测模型轻量, 同时, 通过引入融合侧连接, 将各层级特征进行充分融合, 使得该检测模型性能与现有的较大模型相当。 本申请的图像说 明 书 1/8 页 3 CN 115512135 A 3

.PDF文档 专利 一种图像显著目标检测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像显著目标检测方法 第 1 页 专利 一种图像显著目标检测方法 第 2 页 专利 一种图像显著目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:55:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。