一种源多媒体确定方法、装置、设备及存储介质制造方法及图纸

技术编号:22722544 阅读:21 留言:0更新日期:2019-12-04 05:31
本申请公开了一种源多媒体确定方法、装置、设备及存储介质,涉及智能搜索技术领域。具体实现方案为:获取多媒体片段对应的至少一个多媒体关联信息;其中多媒体关联信息包括多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;对各多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与多媒体片段对应的至少一个关联多媒体;从各关联多媒体中确定与多媒体片段对应的源多媒体。本申请的技术方案通过多媒体关联信息对应的实体和预设知识图谱相结合,确定了关联多媒体,缩小了源多媒体的确定范围,从关联多媒体中进行源多媒体的确定,减少了非真实源多媒体的干扰,提高了源多媒体确定效率和准确率。

A method, device, device and storage medium for source multimedia

The application discloses a source multimedia determination method, device, device and storage medium, and relates to the field of intelligent search technology. The specific implementation scheme is as follows: obtain at least one multimedia association information corresponding to the multimedia clip; the multimedia association information includes at least one of the description text of the multimedia clip, the recognition result of the media element, and the user input label information; extract the entity of each multimedia association information, and determine the multimedia association information according to the extracted entity and the preset knowledge map At least one associated multimedia corresponding to the body segment; the source multimedia corresponding to the multimedia segment is determined from each associated multimedia. The technical scheme of the application combines the entity corresponding to the multimedia association information with the preset knowledge map, determines the associated multimedia, reduces the determination range of the source multimedia, determines the source multimedia from the associated multimedia, reduces the interference of the non real source multimedia, and improves the determination efficiency and accuracy of the source multimedia.

【技术实现步骤摘要】
一种源多媒体确定方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及智能搜索

技术介绍
随着互联网上多媒体资源(例如音视频数据)的增多,有越来越多的多媒体相关的应用,例如多媒体数据推荐、多媒体数据搜索等。这类应用在用于精准推荐、搜索推荐以及精准搜索等场景时,需要对多媒体的来源数据进行定位。现有技术通常使用指纹识别技术,将多媒体片段与多个多媒体数据通过指纹信息的提取和比对,从多个多媒体数据中确定与多媒体片段对应的源多媒体。然而,指纹提取和指纹比对耗时较长,使得源多媒体确定过程整体耗时较长;另外,仅通过指纹提取和比对的方式容易受添加有多媒体片段的娱乐新闻等非真实源数据的干扰,将娱乐新闻误判为源多媒体,降低了所确定的源多媒体的准确性。
技术实现思路
本申请实施例提供了一种源多媒体确定方法、装置、设备及存储介质,以提高源多媒体的确定效率和确定结果的准确性。第一方面,本申请实施例提供了一种源多媒体确定方法,包括:获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。上述申请中的一个实施例通过多媒体片段对应的多媒体关联信息的获取,并提取多媒体关联信息的实体,根据所提取实体和预设知识图谱进行关联多媒体的筛选,进而从关联多媒体中确定与多媒体片段对应的源多媒体,解决了源多媒体确定过程耗时时间长,源多媒体确定准确度较低的问题。本申请的技术方案通过不同维度下的多媒体关联信息对应的实体和预设知识图谱相结合,确定了关联多媒体,缩小了源多媒体的确定范围,从关联多媒体中进行源多媒体的确定,减少了非真实源多媒体的干扰,提高了源多媒体的确定效率和准确率。可选的,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体,包括:根据所提取的各实体和所述知识图谱对应的三元组信息,确定至少一个多媒体实体,并将各多媒体实体对应的多媒体数据作为关联多媒体。上述申请中的一个实施例通过所提取的各实体和知识图谱对应的三元组信息进行多媒体实体的确定,通过知识图谱对所提取的实体进行扩充,进一步挖掘与多媒体片段对应的实体信息;对扩充后的实体中的非多媒体实体进行剔除,进一步减少了所确定的关联多媒体的数量,提高了关联多媒体与多媒体片段对应的源多媒体之间的相关度。可选的,在确定至少一个多媒体实体之后,在将各多媒体实体对应的多媒体数据作为关联多媒体之前,所述方法还包括:根据各多媒体实体的确定频次和/或各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度;从各多媒体实体中筛选出置信度满足设定条件的多媒体实体;相应的,将各多媒体实体对应的多媒体数据作为关联多媒体,包括:将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。上述申请中的一个实施例通过各多媒体实体的确定频次和/或各多媒体实体对应的文件关联信息的类别,进行多媒体实体的置信度的确定,并通过所确定的置信度对多媒体实体进行筛选,减少了多媒体实体的数量,进一步缩小了所确定的关联多媒体的数量,间接提高了关联多媒体与多媒体片段对应的源多媒体之间的相关度。可选的,根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度,包括:针对每个多媒体实体,根据不同类别多媒体关联信息对应的置信权重,对所述多媒体实体的确定频次进行加权;根据加权后的多媒体实体的频次,确定所述多媒体实体对应的置信度。上述申请中的一个实施例通过细化根据各多媒体实体的确定频次和各多媒体实体对应的多媒体关联信息的类别,进行置信度的确定,完善了置信度的确定机制,从确定频次和多媒体关联信息的类别两个维度进行置信度的确定,提高了置信度与多媒体片段之间的关联性,使得多媒体实体的置信度越高,该多媒体实体对应的多媒体数据为多媒体片段对应的源多媒体的可能性越大,间接提高了所确定的关联多媒体与多媒体片段之间的相关度。可选的,从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体,包括:分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度;根据各所述相似度,从所述关联多媒体中确定与所述多媒体片段对应的源多媒体。上述申请中的一个实施例通过指纹信息相似度的确定,进行关联多媒体与多媒体片段的比对,进而从关联多媒体中进行与多媒体片段对应的源多媒体的确定,完善了源多媒体的确定机制,同时进一步提高了源多媒体的确定结果的准确性。可选的,在分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度之前,所述方法还包括:利用所述知识图谱中的多媒体实体对应的播放链接,抓取所述多媒体实体对应的多媒体数据,并提取所述多媒体数据的指纹信息;将所述多媒体数据的指纹信息与所述多媒体实体关联存储,形成多媒体指纹库。可选的,分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度,包括:根据各所述关联多媒体的多媒体实体,在所述多媒体指纹库中查找与各所述关联多媒体对应的指纹信息;提取所述多媒体片段的指纹信息,并分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度。上述申请中的一个实施例通过预先进行多媒体指纹库的构建,避免了进行源多媒体确定过程中进行指纹信息的提取操作,从而减少了源多媒体确定时的数据运算量,进一步提高了源多媒体的确定效率。第二方面,本申请实施例还提供了一种源多媒体确定装置,包括:关联信息获取模块,用于获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;关联多媒体确定模块,用于对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;源多媒体确定模块,用于从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。第三方面,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面实施例所提供的一种源多媒体确定方法。第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面实施例所提供的一种源多媒体确定方法。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用本文档来自技高网...

【技术保护点】
1.一种源多媒体确定方法,其特征在于,包括:/n获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;/n对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;/n从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。/n

【技术特征摘要】
1.一种源多媒体确定方法,其特征在于,包括:
获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;
对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;
从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。


2.根据权利要求1所述的方法,其特征在于,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体,包括:
根据所提取的各实体和所述知识图谱对应的三元组信息,确定至少一个多媒体实体,并将各多媒体实体对应的多媒体数据作为关联多媒体。


3.根据权利要求2所述的方法,其特征在于,在确定至少一个多媒体实体之后,在将各多媒体实体对应的多媒体数据作为关联多媒体之前,所述方法还包括:
根据各多媒体实体的确定频次和/或各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度;
从各多媒体实体中筛选出置信度满足设定条件的多媒体实体;
相应的,将各多媒体实体对应的多媒体数据作为关联多媒体,包括:
将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。


4.根据权利要求3所述的方法,其特征在于,根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度,包括:
针对每个多媒体实体,根据不同类别多媒体关联信息对应的置信权重,对所述多媒体实体的确定频次进行加权;
根据加权后的多媒体实体的频次,确定所述多媒体实体对应的置信度。


5.根据权利要求1-4任一项所述的方法,其特征在于,从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体,包括:
分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度;
根据各所述相似度,从...

【专利技术属性】
技术研发人员:张晓寒任可欣冯知凡张扬朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利