相关素材获取方法、装置及存储介质制造方法及图纸

技术编号:33085243 阅读:13 留言:0更新日期:2022-04-15 10:47
本发明专利技术提供一种相关素材获取方法、装置及存储介质,通过为上传的素材配置第一标签,并根据所述第一标签构建第一特征矩阵;为所述素材配置第二标签,并根据所述第二标签构建第二特征矩阵;分别基于第一特征矩阵和第二特征矩阵计算素材之间的相似度,得到第一计算结果和第二计算结果,对所述第一计算结果和第二计算结果进行加权求和得到最终计算结果;在租户选择素材后,根据租户的ID和租户所选择素材的ID匹配出对应的相关素材结果。实现了为不同租户提供符合其运用场景的相关素材获取。提供符合其运用场景的相关素材获取。提供符合其运用场景的相关素材获取。

【技术实现步骤摘要】
相关素材获取方法、装置及存储介质


[0001]本申请涉及素材推荐
,具体而言,涉及一种相关素材获取方法、装置及存储介质。

技术介绍

[0002]现有的内容推荐技术,是通过识别出素材中的图案、文字,将其转化成数字向量,从而进行相似度计算推荐。但其推荐算法主要是基于user

base和item

base的协同过滤,user

base的协同过滤是发掘用户之间的相似性,item

base的协同过滤是挖掘素材之间的相似性,而无论是item

base还是user

base的推荐都需要使用到大量用户的历史数据,同时在冷启动阶段,协同过滤算法会在用户历史行为的基础上引入知识图谱,从而增加被推荐物品的相关性。
[0003]上述传统内容推荐技术中存在依赖大量用户的历史数据,无法适用于人员数量有限,并且同一人每次会根据不同的工作内容进行不同检索的场景的问题;以及由于常规图像模型的理解准确率有限,导致其准确率在不同租户数据上并不能很好泛化的问题;以及仅根据模型训练生成的标签来召回而导致召回结果不准确的问题。
[0004]因此,亟需一种可以为不同租户提供符合其运用场景的相关素材获取方法。

技术实现思路

[0005]本专利技术实施例提供一种相关素材获取方法、装置及存储介质,用以解决传统内容推荐技术中存在依赖大量租户的历史数据,无法适用于人员数量有限,并且同一人每次会根据不同的工作内容进行不同检索的场景的问题;以及由于常规图像模型的理解准确率有限,导致其准确率在不同租户数据上并不能很好泛化的问题;以及仅根据模型训练生成的标签来召回而导致召回结果不准确的问题。
[0006]本专利技术实施例的第一方面,提供一种相关素材获取方法,包括:
[0007]为上传的素材配置第一标签,并根据所述第一标签构建第一特征矩阵;
[0008]为所述素材配置第二标签,并根据所述第二标签构建第二特征矩阵;
[0009]分别基于第一特征矩阵和第二特征矩阵计算素材之间的相似度,得到第一计算结果和第二计算结果,对所述第一计算结果和第二计算结果进行加权求和得到最终计算结果;
[0010]在租户选择素材后,根据租户的ID和租户所选择素材的ID匹配出对应的相关素材结果。
[0011]可选地,在第一方面的一种可能实现方式中,所述为所述素材配置第二标签,包括:
[0012]所述第二标签包括:场景标签、ocr标签、logo标签、内容物体标签;
[0013]所述场景标签是通过Efficientnet生成的;
[0014]所述ocr标签和logo标签是通过VGG模型进行目标检测,和Resnet网络进行目标识
别得到的;
[0015]所述内容物体标签是通过FastR

CNN模型输出的。
[0016]可选地,在第一方面的一种可能实现方式中,所述根据所述第二标签构建第二特征矩阵,包括:
[0017]所述第二特征矩阵的矩阵行数为所有素材的总数,矩阵列数为所有素材产生的所有标签去重后的数量;
[0018]将素材对应不同标签的置信度分别输入至所述第二特征矩阵中,如果该素材没有对应标签,则该素材在该对应标签下的置信度为零。
[0019]可选地,在第一方面的一种可能实现方式中,所述分别基于第一特征矩阵和第二特征矩阵计算所述素材之间的相似度,得到第一计算结果和第二计算结果,包括:
[0020]通过第一特征矩阵计算第一素材和第二素材的相似度,得到第一计算结果,并存储至云端;采用如下公式:
[0021][0022]其中,分子代表第一素材、第二素材出现在同一标签的次数;分母代表第一惩罚因子,表示第一素材包含的标签总数与第二标签包含的标签总数的乘积开根号。
[0023]可选地,在第一方面的一种可能实现方式中,所述基于第一特征矩阵和第二特征矩阵分别计算素材之间的相似度,得到第一计算结果和第二计算结果,包括:
[0024]通过第二特征矩阵计算第一素材和第二素材的相似度,得到第二计算结果,并存储至云端;采用如下公式:
[0025][0026]其中,分子代表第一素材、第二素材出现在同一标签的相似度分数的乘积,分母代表第二惩罚因子,所述第二惩罚因子用于对置信度低于第一预设阈值的标签进行惩罚。
[0027]可选地,在第一方面的一种可能实现方式中,所述方法还包括:
[0028]基于第二预设阈值对所述相关素材结果进行筛选,所述第二预设阈值的大小是根据租户的租户信息决定的。
[0029]本专利技术实施例的第二方面,提供一种相关素材获取装置,包括:
[0030]第一构建模块,用于为上传的素材配置第一标签,并根据所述第一标签构建第一特征矩阵;
[0031]第二构建模块,用于为所述素材配置第二标签,并根据所述第二标签构建第二特征矩阵;
[0032]相似度计算模块,用于分别基于第一特征矩阵和第二特征矩阵计算素材之间的相似度,得到第一计算结果和第二计算结果,对所述第一计算结果和第二计算结果进行加权求和得到最终计算结果;
[0033]匹配模块,用于在租户选择素材后,根据租户的ID和租户所选择素材的ID匹配出
对应的相关素材结果。
[0034]可选地,在第二方面的一种可能实现方式中,所述第二构建模块包括:
[0035]所述第二标签包括:场景标签、ocr标签、logo标签、内容物体标签;
[0036]所述场景标签是通过Efficientnet生成的;
[0037]所述ocr标签和logo标签是通过VGG模型进行目标检测,和Resnet网络进行目标识别得到的;
[0038]所述内容物体标签是通过FastR

CNN模型输出的。
[0039]可选地,在第二方面的一种可能实现方式中,所述第二构建模块还包括:
[0040]所述第二特征矩阵的矩阵行数为所有素材的总数,矩阵列数为所有素材产生的所有标签去重后的数量;
[0041]将素材对应不同标签的置信度分别输入至所述第二特征矩阵中,如果该素材没有对应标签,则该素材在该对应标签下的置信度为零。
[0042]本专利技术实施例的第三方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本专利技术第一方面及第一方面各种可能设计的所述方法。
[0043]本专利技术提供的相关素材获取方法、装置及存储介质,通过为上传的素材配置第一标签,并根据所述第一标签构建第一特征矩阵;为所述素材配置第二标签,并根据所述第二标签构建第二特征矩阵;分别基于第一特征矩阵和第二特征矩阵计算素材之间的相似度,得到第一计算结果和第二计算结果,对所述第一计算结果和第二计算结果进行加权求和得到最终计算结果;在租户选择素材后,根据租户的ID和租户所选择素材的ID匹配出对应的相关素本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相关素材获取方法,其特征在于,包括:为上传的素材配置第一标签,并根据所述第一标签构建第一特征矩阵;为所述素材配置第二标签,并根据所述第二标签构建第二特征矩阵;分别基于第一特征矩阵和第二特征矩阵计算素材之间的相似度,得到第一计算结果和第二计算结果,对所述第一计算结果和第二计算结果进行加权求和得到最终计算结果;在租户选择素材后,根据租户的ID和租户所选择素材的ID匹配出对应的相关素材结果。2.根据权利要求1所述的相关素材获取方法,其特征在于,所述为所述素材配置第二标签,包括:所述第二标签包括:场景标签、ocr标签、logo标签、内容物体标签;所述场景标签是通过Efficientnet生成的;所述ocr标签和logo标签是通过VGG模型进行目标检测,和Resnet网络进行目标识别得到的;所述内容物体标签是通过FastR

CNN模型输出的。3.根据权利要求1所述的相关素材获取方法,其特征在于,所述根据所述第二标签构建第二特征矩阵,包括:所述第二特征矩阵的矩阵行数为所有素材的总数,矩阵列数为所有素材产生的所有标签去重后的数量;将素材对应不同标签的置信度分别输入至所述第二特征矩阵中,如果该素材没有对应标签,则该素材在该对应标签下的置信度为零。4.根据权利要求1所述的相关素材获取方法,其特征在于,所述分别基于第一特征矩阵和第二特征矩阵计算所述素材之间的相似度,得到第一计算结果和第二计算结果,包括:通过第一特征矩阵计算第一素材和第二素材的相似度,得到第一计算结果,并存储至云端;采用如下公式:其中,分子代表第一素材、第二素材出现在同一标签的次数;分母代表第一惩罚因子,表示第一素材包含的标签总数与第二标签包含的标签总数的乘积开根号。5.根据权利要求4所述的相关素材获取方法,其特征在于,所述基于第一特征矩阵和第二特征矩阵分别计算素材之间的相似度,得到第一计算结果和第二计算结果,包括:通过第二特征矩阵计算第一素材和第二素材的相似度...

【专利技术属性】
技术研发人员:范凌蒋兆湘王喆
申请(专利权)人:特赞上海信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1