(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210458542.8
(22)申请日 2022.04.24
(71)申请人 腾讯音乐娱乐科技 (深圳) 有限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室
(72)发明人 王朋
(74)专利代理 机构 北京三高永信知识产权代理
有限责任公司 1 1138
专利代理师 孙晓丽
(51)Int.Cl.
G06F 16/75(2019.01)
G06F 16/783(2019.01)
G06V 10/44(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
(54)发明名称
训练视频特征提取模型和视频推荐的方法
和装置
(57)摘要
本申请公开了一种训练视频特征提取模型
和视频推荐的方法和装置, 属于计算机技术领
域。 该方法包括: 基于待训练的视频特征提取模
型对目标样 本视频的属性信息进行特征提取, 得
到视频特征信息, 基于待训练的账户特征提取模
型对样本账户对应的视频类型偏好信息进行特
征提取, 得到 账户特征信息; 将视频特征信息、 账
户特征信息输入待训练的视频相似度预测模型,
输出预测相似度; 基于预测相似度和基准相似度
对待训练的视频特征提取模型、 待训练的账户特
征提取模型和待训练的视频相似度预测模型进
行调参。 采用本申请, 可 以基于目标样本视频本
身的属性特征和播放过该目标样本视频的样本
账户的视频类型偏好信息得到较为准确的视频
特征信息。
权利要求书3页 说明书20页 附图12页
CN 114996509 A
2022.09.02
CN 114996509 A
1.一种训练视频 特征提取模型的方法, 其特 征在于, 所述方法包括:
获取样本账户播放过的目标样本视频的属性信 息、 所述目标样本视频对应的参考样本
视频、 以及所述目标样本 视频与所述 参考样本视频的基准相似度;
基于待训练的视频特征提取模型对所述属性信息进行特征提取, 得到视频特征信息,
基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进 行特征提取,
得到账户特 征信息;
将所述视频特征信息、 所述账户特征信息输入待训练的视频相似度预测模型, 输出所
述目标样本 视频与所述 参考样本视频的预测相似度;
基于所述预测相似度和所述基准相似度, 对所述待训练的视频特征提取模型、 所述待
训练的账户特 征提取模型和所述待训练的视频相似度预测模型进行调参;
若满足预设结束条件, 则将调参后的视频特征提取模型确定为训练完成的视频特征提
取模型。
2.根据权利要求1所述的方法, 其特征在于, 所述参考样本视频包括正样本视频和负样
本视频, 所述目标样本视频与所述参考样本视频的基准相似度包括所述目标样本视频与所
述正样本视频的第一基准相似度、 以及所述目标样本视频与所述负样本视频的第二基准相
似度;
获取所述目标样本视频对应的参考样本视频、 以及所述目标样本视频与所述参考样本
视频的基准相似度, 包括:
获取所述样本账户播放过、 且与所述目标样本视频满足播放时间接近条件的视频, 作
为所述目标样本 视频对应的正样本 视频, 其中, 所述第一基准相似度为第一数值;
获取除了所述目标样本视频和所述正样本视频之外的视频, 作为所述目标样本视频对
应的负样本视频, 其中, 所述第二基准相似度为第二数值, 所述第二数值小于所述第一数
值。
3.根据权利要求2所述的方法, 其特征在于, 所述获取所述样本账户播放过、 且与所述
目标样本视频满足播放时间接近条件的视频, 作为所述 目标样本视频对应的正样本视频,
包括:
获取所述样本账户播放过、 且播放 时间点与所述目标样本视频的播放 时间点之间的时
间差值小于预设时差阈值的至少一个视频, 作为待定正样本 视频;
基于播放时间点, 将所述待定正样本 视频按顺序排列, 得到待定正样本 视频序列;
将在所述待定正样本视频序列中, 与所述目标样本视频之间间隔视频的数目小于预设
数目的待定正样本 视频, 确定为所述目标样本 视频对应的正样本 视频。
4.根据权利要求1所述的方法, 其特征在于, 所述目标样本视频的属性信 息包括所述目
标样本视频的标识信息和所述 目标样本视频 的边信息, 其中, 所述 目标样本视频的标识信
息用于表示所述目标样本视频的唯一标志, 所述目标样本视频的边信息是与所述目标样本
视频的视频内容相关联的信息;
所述获取样本账户播 放过的目标样本 视频的属性信息, 包括:
在视频库中获取所述目标样本视频的标识信 息、 以及所述目标样本视频对应的图像数
据和音频 数据;
对所述目标样本视频对应的图像数据进行图像识别处理, 并对所述目标样本视频对应权 利 要 求 书 1/3 页
2
CN 114996509 A
2的音频数据进行音频识别处 理, 得到所述目标样本 视频的边信息 。
5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
获取所述样本账户的历史播放数据, 所述历史播放数据包括在历史时段内所述样本账
户播放过的历史视频和每个历史视频对应的播放时长占比, 所述历史视频对应的播放时长
占比是所述历史视频的播 放时长与所述历史视频的总时长的比值;
将对应的播放 时长占比大于或等于播放 时长占比阈值的历史视频, 确定为所述样本账
户对应的历史偏好视频;
基于每个历史偏好视频对应的视频类型, 确定所述样本账户对应的视频类型偏好信
息。
6.根据权利要求1所述的方法, 其特征在于, 所述待训练 的视频特征提取模型包括待训
练的第一 参数矩阵, 所述待训练的账户特 征提取模型包括待训练的第二 参数矩阵;
所述基于待训练 的视频特征提取模型对所述属性信 息进行特征提取, 得到视频特征信
息, 包括:
对所述属性信息进行哈希计算, 得到所述属性信息对应的第一哈希值;
在所述待训练 的第一参数矩阵中获取所述第 一哈希值对应的第 一特征信 息, 作为所述
视频特征信息;
所述基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行
特征提取, 得到账户特 征信息, 包括:
对所述视频类型偏好信 息进行哈希计算, 得到所述视频类型偏好信 息对应的第 二哈希
值;
在所述待训练 的第二参数矩阵中获取所述第 二哈希值对应的第 二特征信 息, 作为所述
账户特征信息。
7.根据权利要求1所述的方法, 其特征在于, 所述视频相似度预测模型包括隐藏层和分
类层;
所述基于所述视频特征信息、 所述账户特征信息和待训练的视频相似度预测模型, 确
定所述目标样本 视频与所述 参考样本视频的预测相似度, 包括:
将所述视频 特征信息和所述账户特 征信息, 输入待训练的隐藏层, 得到组合特 征信息;
将所述组合特征信 息输入待训练的分类层, 得到所述目标样本视频与 所述参考样本视
频的预测相似度。
8.一种视频推荐的方法, 其特 征在于, 所述方法包括:
基于权利要求1 ‑7任一项所述的训练完成的视频特征提取模型, 分别对视频库中的各
视频进行 特征提取, 得到每 个视频对应的视频 特征信息;
接收目标终端发送 的视频推荐请求, 其中, 所述视频推荐请求携带有所述目标终端最
新播放视频的标识信息;
确定所述 最新播放视频对应的视频 特征信息;
基于所述最新播放视频对应的视频特征信 息和所述每个视频对应的视频特征信 息, 确
定每个视频与所述 最新播放视频的相似度;
基于所述每个视频与最新播放视频的相似度, 在所述各视频中, 确定所述最新播放视
频对应的目标推荐视频, 向所述目标终端发送所述目标推荐视频。权 利 要 求 书 2/3 页
3
CN 114996509 A
3
专利 训练视频特征提取模型和视频推荐的方法和装置
文档预览
中文文档
36 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:59:45上传分享