国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210526829.X (22)申请日 2022.05.12 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 李弼 彭楠 希滕 张刚  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 杨静 (51)Int.Cl. G06V 20/40(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) G06V 10/74(2022.01)G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称 训练方法、 图像处理方法、 装置、 电子设备以 及存储介质 (57)摘要 本公开提供了一种训练方法、 图像处理方 法、 装置、 电子设备以及存储介质, 涉及人工智能 技术领域, 尤其涉及深度学习、 图像处理、 计算机 视觉技术领域, 可应用于OCR、 人脸等识别场景。 具体实现方案为: 从第一视频序列中确定目标对 象的第一对象图像; 根据第一对象图像, 确定目 标对象的第一样本图像对; 基于对比损失函数和 第一样本图像对训练深度学习模 型, 得到预训练 模型。 权利要求书4页 说明书17页 附图9页 CN 114898266 A 2022.08.12 CN 114898266 A 1.一种深度学习模型的训练方法, 包括: 从第一视频序列中确定目标对象的第一对象图像; 根据所述第一对象图像, 确定所述目标对象的第一样本图像对; 以及 基于对比损失函数和所述第一样本图像对训练深度学习模型, 得到预训练模型。 2.根据权利要求1所述的方法, 其中, 所述目标对象包括多个; 其中, 所述 根据所述第一对象图像, 确定所述目标对象的第一样本图像对, 包括: 根据所述第一对象图像, 确定所述目标对象的特 征数据; 以及 根据所述特 征数据, 确定所述第一样本图像对。 3.根据权利要求2所述的方法, 其中, 所述根据所述特征数据, 确定所述第一样本 图像 对, 包括: 根据所述特 征数据, 对所述第一对象图像进行聚类, 得到多个聚类簇; 以及 根据所述聚类簇, 确定所述第一样本图像对。 4.根据权利要求3所述的方法, 其中, 所述根据 所述聚类簇, 确定所述第 一样本图像对, 包括: 在确定所述聚类簇 中包括多个所述第 一对象图像的情况下, 将多个所述第 一对象图像 确定为多个第一 正样本图像; 根据所述第一 正样本图像, 获取第一 正样本图像对; 以及 根据所述第一 正样本图像对, 确定所述第一样本图像对。 5.根据权利要求 4所述的方法, 还 包括: 根据第一图像数据, 确定所述目标对象的第一负 样本图像对; 其中, 所述第 一图像数据包括以下至少之一: 第 二对象图像和其他聚类簇, 所述第二对 象图像是第二视频序列中的第一预定对象图像, 所述其他聚类簇是所述多个聚类簇中除与 所述目标对象对应的聚类簇以外的至少部分聚类簇; 其中, 所述 根据所述第一 正样本图像对, 确定所述第一样本图像对, 包括: 根据所述第一 正样本图像对和所述第一负 样本图像对, 获取 所述第一样本图像对。 6.根据权利要求2~5 中任一项所述的方法, 其中, 所述特征数据包括以下至少之一: 低 层特征数据和高层特征数据, 所述低层特征数据包括以下至少之一: 低层图像特征数据和 位置数据; 其中, 所述低层图像特征数据 是利用低层图像特征提取算法处理所述第 一视频序列中 的所述第一对象图像得到的; 其中, 所述高层特征数据是利用与 预定轮次对应的深度 学习模型处理所述第 一视频序 列中的所述第一对象图像得到的。 7.根据权利要求1~6中任一项所述的方法, 其中, 所述目标对象包括 一个; 其中, 所述 根据所述第一对象图像, 确定所述目标对象的第一样本图像对, 包括: 将所述第一对象图像确定为所述目标对象的第二 正样本图像; 在确定所述第一对象图像为至少两个的情况下, 根据所述第二正样本 图像, 确定第二 正样本图像对; 以及 根据所述第二 正样本图像对, 确定所述第一样本图像对。 8.根据权利要求7 所述的方法, 还 包括:权 利 要 求 书 1/4 页 2 CN 114898266 A 2根据第二图像数据, 确定所述目标对象的第二负样本图像对, 其中, 所述第 二图像数据 包括第三对象图像, 所述第三对象图像是第三视频序列中的第二预定对象图像; 其中, 所述 根据所述第二 正样本图像对, 确定所述第一样本图像对, 包括: 根据所述第二 正样本图像对和所述第二负 样本图像对, 获取 所述第一样本图像对。 9.根据权利要求1~8中任一项所述的方法, 其中, 所述从第一视频序列中确定目标对 象的第一对象图像, 包括: 确定所述第一视频序列包括的所述目标对象; 以及 根据所述目标对象的位置信息, 从所述第一视频序列中确定所述第一对象图像。 10.根据权利要求1~9中任一项所述的方法, 其中, 所述基于对比损失函数和所述第 一 样本图像对训练深度学习模型, 得到预训练模型, 包括: 确定所述第一样本图像对 包括的样本图像之间的相似度; 基于所述相似度和所述对比损失函数, 得到 输出值; 以及 根据所述输出值调整所述深度学习模型的模型参数, 直至满足预定结束条件。 11.一种图像处 理模型的训练方法, 包括: 利用样本图像训练预训练模型, 得到所述图像处 理模型, 其中, 所述预训练模型 是利用根据权利要求1~10中任一项所述的方法训练得到的。 12.一种图像处 理方法, 包括: 将目标图像输入图像处 理模型, 得到图像处 理结果, 其中, 所述图像处 理模型是利用根据权利要求1 1所述的方法训练得到的。 13.一种深度学习模型的训练装置, 包括: 第一确定模块, 用于从第一视频序列中确定目标对象的第一对象图像; 第二确定模块, 用于根据 所述第一对象图像, 确定所述目标对象的样第 一样本图像对; 以及 第一训练模块, 用于基于对比损 失函数和所述第一样本 图像对训练深度学习模型, 得 到预训练模型。 14.根据权利要求13所述的装置, 其中, 所述目标对象包括多个; 其中, 所述第二确定模块, 包括: 第一确定 子模块, 用于根据第一对象图像, 确定所述目标对象的特 征数据; 以及 第二确定 子模块, 用于根据所述特 征数据, 确定所述第一样本图像对。 15.根据权利要求14所述的装置, 其中, 所述第二确定 子模块, 包括: 聚类单元, 用于根据所述特征数据, 对所述第一对象图像进行聚类, 得到多个聚类簇; 以及 确定单元, 用于根据所述聚类簇, 确定所述第一样本图像对。 16.根据权利要求15所述的装置, 其中, 所述确定单 元, 包括: 第一确定子单元, 用于在确定所述聚类簇中包括多个所述第一对象图像的情况下, 将 多个所述第一对象图像确定为多个第一 正样本图像; 获取子单 元, 用于根据所述第一 正样本图像, 获取第一 正样本图像对; 以及 第二确定 子单元, 用于根据所述第一 正样本图像对, 确定所述第一样本图像对。 17.根据权利要求16所述的装置, 所述确定单 元还包括:权 利 要 求 书 2/4 页 3 CN 114898266 A 3

PDF文档 专利 训练方法、图像处理方法、装置、电子设备以及存储介质

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练方法、图像处理方法、装置、电子设备以及存储介质 第 1 页 专利 训练方法、图像处理方法、装置、电子设备以及存储介质 第 2 页 专利 训练方法、图像处理方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。