评论信息的确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25948525 阅读:28 留言:0更新日期:2020-10-17 03:40
本发明专利技术实施例提供了一种评论信息的确定方法、装置、电子设备及存储介质。该方法包括:从多个多媒体对象中,确定出不相似对象对;获取每一个不相似对象对中的多媒体对象的评论信息中的相同评论信息,并确定为候选信息;获取候选信息的出现次数;根据候选信息的出现次数,从候选信息中选出至少部分信息,并确定为通用型评论;剔除多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息,因此,本发明专利技术的方案,可以解决现有技术中从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解的问题。

【技术实现步骤摘要】
评论信息的确定方法、装置、电子设备及存储介质
本公开涉及计算机
,尤其涉及一种评论信息的确定方法、装置、电子设备及存储介质。
技术介绍
各短视频平台上的视频在被用户评论后,经常出现很多没有意义的通用型评论比如“666”、“赞赞赞”、“玫瑰玫瑰”。这些评论对视频的分析和理解是不利的。因此,可以借助算法的能力识别并剔除掉这些通用型评论,然后保留与视频有较大信息关联的评论,从而帮助后续的视频理解和分析。其中,现有技术中,为了获取上述通用型的评论,往往将全部视频下的评论进行计数统计,然后取评论数最多的前几条评论作为通用型评论信息。然而,此种方式所提取的通用型评论中往往也会包括较多与视频有较大信息关联的相似评论,从而在将这些评论也当作通用型评论剔除时,不便于后续对视频的理解和分析。由此可见,现有技术中,从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解。
技术实现思路
本专利技术实施例提供一种评论信息的确定方法、装置、电子设备及存储介质,以解决现有技术中从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解的问题。根据本专利技术实施例的第一方面,提供一种评论信息的确定方法,包括:从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个所述多媒体对象,且一个所述不相似对象对中包括的两个所述多媒体对象的相似度小于第一预设阈值;获取每一个所述不相似对象对中的所述多媒体对象的评论信息中的相同评论信息,并确定为候选信息;获取所述候选信息中的每一种候选信息的出现次数;根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论;剔除所述多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息。可选的,所述从多个多媒体对象中,确定出不相似对象对,包括:获取每一个所述多媒体对象的特征信息;根据所述特征信息,确定所述多媒体对象的特征向量;获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度;将小于所述第一预设阈值的相似度对应的两个所述多媒体对象,确定为一个不相似对象对。可选的,所述获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度,包括:采用余弦相似度算法,获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度。可选的,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:将所述候选信息中出现次数大于第二预设阈值的候选信息,确定为通用型评论。可选的,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:按照所述出现次数由大到小的顺序,对所述候选信息进行排序;将所述排序中,位于前预设数量的候选信息,确定为通用型评论。根据本专利技术实施例的第二方面,提供一种评论信息的确定装置,包括:对象对确定模块,被配置为从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个所述多媒体对象,且一个所述不相似对象对中包括的两个所述多媒体对象的相似度小于第一预设阈值;候选信息确定模块,被配置为获取每一个所述不相似对象对中的所述多媒体对象的评论信息中的相同评论信息,并确定为候选信息;次数统计模块,被配置为获取所述候选信息中的每一种候选信息的出现次数;筛选模块,被配置为根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论;目标评论信息确定模块,被配置为剔除所述多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息。可选的,所述对象对确定模块包括:特征信息确定单元,被配置为获取每一个所述多媒体对象的特征信息;特征向量确定单元,被配置为根据所述特征信息,确定所述多媒体对象的特征向量;相似度计算单元,被配置为获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度;对象对确定单元,被配置为将小于所述第一预设阈值的相似度对应的两个所述多媒体对象,确定为一个不相似对象对。可选的,所述相似度计算单元具体被配置为:采用余弦相似度算法,获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度。可选的,所述筛选模块包括:第一筛选单元,被配置为将所述候选信息中出现次数大于第二预设阈值的候选信息,确定为通用型评论。可选的,所述筛选模块包括:排序单元,被配置为按照所述出现次数由大到小的顺序,对所述候选信息进行排序;第二筛选单元,被配置为将所述排序中,位于前预设数量的候选信息,确定为通用型评论。根据本专利技术实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行以实现上述所述的评论信息的确定方法所执行的操作。根据本专利技术实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种以实现上述所述的评论信息的确定方法所执行的操作。与现有技术相比,本专利技术具有以下优点:本专利技术的实施例,从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个相似度小于第一预设阈值的多媒体对象,然后获取每一个不相似对象对中的两个多媒体对象的评论信息中的相同评论信息,再根据这些相同评论信息的出现次数,筛选出通用型评论,进而从上述多个多媒体对象的评论信息中将出现的通用型评论剔除,则可以获取到这些多媒体对象的目标评论信息(即有效性评论信息)。其中,不相似的多媒体对象的评论信息中的相同评论信息中不可能包括与多媒体对象的特征有较大关联的相似评论,因而,本专利技术的实施例,从多媒体对象的特征出发,在不相似的多媒体对象的评论信息中的相同评论信息中,提取通用型评论,可以在一定程度上避免将与多媒体对象的特征有较大信息关联的相似评论确定为通用型评论,从而提升了通用型评论的准确度,亦即提升了确定有效性评论信息的准确度,进而有利于后续根据有效性评论信息分析和理解多媒体对象。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例一的评论信息的确定方法的流程图;图2是本专利技术实施例二的评论信息的确定方法的流程图;图3是本专利技术实施例三的评论信息的确定装置的结构框图;本文档来自技高网...

【技术保护点】
1.一种评论信息的确定方法,其特征在于,包括:/n从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个所述多媒体对象,且一个所述不相似对象对中包括的两个所述多媒体对象的相似度小于第一预设阈值;/n获取每一个所述不相似对象对中的所述多媒体对象的评论信息中的相同评论信息,并确定为候选信息;/n获取所述候选信息中的每一种候选信息的出现次数;/n根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论;/n剔除所述多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息。/n

【技术特征摘要】
1.一种评论信息的确定方法,其特征在于,包括:
从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个所述多媒体对象,且一个所述不相似对象对中包括的两个所述多媒体对象的相似度小于第一预设阈值;
获取每一个所述不相似对象对中的所述多媒体对象的评论信息中的相同评论信息,并确定为候选信息;
获取所述候选信息中的每一种候选信息的出现次数;
根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论;
剔除所述多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息。


2.根据权利要求1所述的评论信息的确定方法,其特征在于,所述从多个多媒体对象中,确定出不相似对象对,包括:
获取每一个所述多媒体对象的特征向量;
获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度;
将小于所述第一预设阈值的相似度对应的两个所述多媒体对象,确定为一个不相似对象对。


3.根据权利要求2所述的评论信息的确定方法,其特征在于,所述获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度,包括:
采用余弦相似度算法,获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度。


4.根据权利要求1所述的评论信息的确定方法,其特征在于,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:
将所述候选信息中出现次数大于第二预设阈值的候选信息,确定为通用型评论。


5.根据权利要求1所述的评论信息的确定方法,其特征在于,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:
按照所述出现次数由大到小的顺序,对所述候选信息进行排序;
将所述排序中,位于前预设数量的候选信息,确定为通用型评论。


6.一种评论信息的确定装置,其特征在...

【专利技术属性】
技术研发人员:申世伟
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1