The application discloses a source multimedia determination method, device, device and storage medium, and relates to the field of intelligent search technology. The specific implementation scheme is as follows: obtain at least one multimedia association information corresponding to the multimedia clip; the multimedia association information includes at least one of the description text of the multimedia clip, the recognition result of the media element, and the user input label information; extract the entity of each multimedia association information, and determine the multimedia association information according to the extracted entity and the preset knowledge map At least one associated multimedia corresponding to the body segment; the source multimedia corresponding to the multimedia segment is determined from each associated multimedia. The technical scheme of the application combines the entity corresponding to the multimedia association information with the preset knowledge map, determines the associated multimedia, reduces the determination range of the source multimedia, determines the source multimedia from the associated multimedia, reduces the interference of the non real source multimedia, and improves the determination efficiency and accuracy of the source multimedia.
【技术实现步骤摘要】
一种源多媒体确定方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及智能搜索
技术介绍
随着互联网上多媒体资源(例如音视频数据)的增多,有越来越多的多媒体相关的应用,例如多媒体数据推荐、多媒体数据搜索等。这类应用在用于精准推荐、搜索推荐以及精准搜索等场景时,需要对多媒体的来源数据进行定位。现有技术通常使用指纹识别技术,将多媒体片段与多个多媒体数据通过指纹信息的提取和比对,从多个多媒体数据中确定与多媒体片段对应的源多媒体。然而,指纹提取和指纹比对耗时较长,使得源多媒体确定过程整体耗时较长;另外,仅通过指纹提取和比对的方式容易受添加有多媒体片段的娱乐新闻等非真实源数据的干扰,将娱乐新闻误判为源多媒体,降低了所确定的源多媒体的准确性。
技术实现思路
本申请实施例提供了一种源多媒体确定方法、装置、设备及存储介质,以提高源多媒体的确定效率和确定结果的准确性。第一方面,本申请实施例提供了一种源多媒体确定方法,包括:获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。上述申请中的一个实施例通过多媒体片段对应的多媒体关联信息的获取,并提取多媒体关联信息的实体,根 ...
【技术保护点】
1.一种源多媒体确定方法,其特征在于,包括:/n获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;/n对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;/n从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。/n
【技术特征摘要】
1.一种源多媒体确定方法,其特征在于,包括:
获取多媒体片段对应的至少一个多媒体关联信息;其中,所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种;
对各所述多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体;
从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体。
2.根据权利要求1所述的方法,其特征在于,根据所提取的各实体和预设知识图谱,确定与所述多媒体片段对应的至少一个关联多媒体,包括:
根据所提取的各实体和所述知识图谱对应的三元组信息,确定至少一个多媒体实体,并将各多媒体实体对应的多媒体数据作为关联多媒体。
3.根据权利要求2所述的方法,其特征在于,在确定至少一个多媒体实体之后,在将各多媒体实体对应的多媒体数据作为关联多媒体之前,所述方法还包括:
根据各多媒体实体的确定频次和/或各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度;
从各多媒体实体中筛选出置信度满足设定条件的多媒体实体;
相应的,将各多媒体实体对应的多媒体数据作为关联多媒体,包括:
将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。
4.根据权利要求3所述的方法,其特征在于,根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别,确定各多媒体实体的置信度,包括:
针对每个多媒体实体,根据不同类别多媒体关联信息对应的置信权重,对所述多媒体实体的确定频次进行加权;
根据加权后的多媒体实体的频次,确定所述多媒体实体对应的置信度。
5.根据权利要求1-4任一项所述的方法,其特征在于,从各所述关联多媒体中,确定与所述多媒体片段对应的源多媒体,包括:
分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度;
根据各所述相似度,从...
【专利技术属性】
技术研发人员:张晓寒,任可欣,冯知凡,张扬,朱勇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。