专利 训练视频特征提取模型和视频推荐的方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210458542.8 (22)申请日 2022.04.24 (71)申请人腾讯音乐娱乐科技（深圳）有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室 (72)发明人王朋　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 专利代理师孙晓丽 (51)Int.Cl. G06F 16/75(2019.01) G06F 16/783(2019.01) G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 10/764(2022.01) (54)发明名称训练视频特征提取模型和视频推荐的方法和装置 (57)摘要本申请公开了一种训练视频特征提取模型和视频推荐的方法和装置，属于计算机技术领域。该方法包括：基于待训练的视频特征提取模型对目标样本视频的属性信息进行特征提取，得到视频特征信息，基于待训练的账户特征提取模型对样本账户对应的视频类型偏好信息进行特征提取，得到账户特征信息；将视频特征信息、账户特征信息输入待训练的视频相似度预测模型，输出预测相似度；基于预测相似度和基准相似度对待训练的视频特征提取模型、待训练的账户特征提取模型和待训练的视频相似度预测模型进行调参。采用本申请，可以基于目标样本视频本身的属性特征和播放过该目标样本视频的样本账户的视频类型偏好信息得到较为准确的视频特征信息。权利要求书3页说明书20页附图12页 CN 114996509 A 2022.09.02 CN 114996509 A 1.一种训练视频特征提取模型的方法，其特征在于，所述方法包括：获取样本账户播放过的目标样本视频的属性信息、所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度；基于待训练的视频特征提取模型对所述属性信息进行特征提取，得到视频特征信息，基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行特征提取，得到账户特征信息；将所述视频特征信息、所述账户特征信息输入待训练的视频相似度预测模型，输出所述目标样本视频与所述参考样本视频的预测相似度；基于所述预测相似度和所述基准相似度，对所述待训练的视频特征提取模型、所述待训练的账户特征提取模型和所述待训练的视频相似度预测模型进行调参；若满足预设结束条件，则将调参后的视频特征提取模型确定为训练完成的视频特征提取模型。 2.根据权利要求1所述的方法，其特征在于，所述参考样本视频包括正样本视频和负样本视频，所述目标样本视频与所述参考样本视频的基准相似度包括所述目标样本视频与所述正样本视频的第一基准相似度、以及所述目标样本视频与所述负样本视频的第二基准相似度；获取所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度，包括：获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频，作为所述目标样本视频对应的正样本视频，其中，所述第一基准相似度为第一数值；获取除了所述目标样本视频和所述正样本视频之外的视频，作为所述目标样本视频对应的负样本视频，其中，所述第二基准相似度为第二数值，所述第二数值小于所述第一数值。 3.根据权利要求2所述的方法，其特征在于，所述获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频，作为所述目标样本视频对应的正样本视频，包括：获取所述样本账户播放过、且播放时间点与所述目标样本视频的播放时间点之间的时间差值小于预设时差阈值的至少一个视频，作为待定正样本视频；基于播放时间点，将所述待定正样本视频按顺序排列，得到待定正样本视频序列；将在所述待定正样本视频序列中，与所述目标样本视频之间间隔视频的数目小于预设数目的待定正样本视频，确定为所述目标样本视频对应的正样本视频。 4.根据权利要求1所述的方法，其特征在于，所述目标样本视频的属性信息包括所述目标样本视频的标识信息和所述目标样本视频的边信息，其中，所述目标样本视频的标识信息用于表示所述目标样本视频的唯一标志，所述目标样本视频的边信息是与所述目标样本视频的视频内容相关联的信息；所述获取样本账户播放过的目标样本视频的属性信息，包括：在视频库中获取所述目标样本视频的标识信息、以及所述目标样本视频对应的图像数据和音频数据；对所述目标样本视频对应的图像数据进行图像识别处理，并对所述目标样本视频对应权　利　要　求　书 1/3 页 2 CN 114996509 A 2的音频数据进行音频识别处理，得到所述目标样本视频的边信息。 5.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述样本账户的历史播放数据，所述历史播放数据包括在历史时段内所述样本账户播放过的历史视频和每个历史视频对应的播放时长占比，所述历史视频对应的播放时长占比是所述历史视频的播放时长与所述历史视频的总时长的比值；将对应的播放时长占比大于或等于播放时长占比阈值的历史视频，确定为所述样本账户对应的历史偏好视频；基于每个历史偏好视频对应的视频类型，确定所述样本账户对应的视频类型偏好信息。 6.根据权利要求1所述的方法，其特征在于，所述待训练的视频特征提取模型包括待训练的第一参数矩阵，所述待训练的账户特征提取模型包括待训练的第二参数矩阵；所述基于待训练的视频特征提取模型对所述属性信息进行特征提取，得到视频特征信息，包括：对所述属性信息进行哈希计算，得到所述属性信息对应的第一哈希值；在所述待训练的第一参数矩阵中获取所述第一哈希值对应的第一特征信息，作为所述视频特征信息；所述基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行特征提取，得到账户特征信息，包括：对所述视频类型偏好信息进行哈希计算，得到所述视频类型偏好信息对应的第二哈希值；在所述待训练的第二参数矩阵中获取所述第二哈希值对应的第二特征信息，作为所述账户特征信息。 7.根据权利要求1所述的方法，其特征在于，所述视频相似度预测模型包括隐藏层和分类层；所述基于所述视频特征信息、所述账户特征信息和待训练的视频相似度预测模型，确定所述目标样本视频与所述参考样本视频的预测相似度，包括：将所述视频特征信息和所述账户特征信息，输入待训练的隐藏层，得到组合特征信息；将所述组合特征信息输入待训练的分类层，得到所述目标样本视频与所述参考样本视频的预测相似度。 8.一种视频推荐的方法，其特征在于，所述方法包括：基于权利要求1 ‑7任一项所述的训练完成的视频特征提取模型，分别对视频库中的各视频进行特征提取，得到每个视频对应的视频特征信息；接收目标终端发送的视频推荐请求，其中，所述视频推荐请求携带有所述目标终端最新播放视频的标识信息；确定所述最新播放视频对应的视频特征信息；基于所述最新播放视频对应的视频特征信息和所述每个视频对应的视频特征信息，确定每个视频与所述最新播放视频的相似度；基于所述每个视频与最新播放视频的相似度，在所述各视频中，确定所述最新播放视频对应的目标推荐视频，向所述目标终端发送所述目标推荐视频。权　利　要　求　书 2/3 页 3 CN 114996509 A 3

专利 训练视频特征提取模型和视频推荐的方法和装置

专利训练视频特征提取模型和视频推荐的方法和装置