The invention relates to a target comment determination method and device. The method includes: obtaining at least two alternative comments for network objects; extracting features of at least two alternative comments, obtaining respective feature information of at least two alternative comments, which is used to indicate the characteristics of the text content of the corresponding alternative comments; and extracting features of at least two alternative comments. Each feature information is input into the presupposed training model, and the corresponding score values of at least two alternative reviews are calculated. According to the corresponding score values of at least two alternative reviews, the target reviews in at least two alternative reviews are determined. This method can select target reviews according to the text content of the reviews, and improve the accuracy of target reviews.
【技术实现步骤摘要】
目标评论确定方法及装置
本专利技术涉及网络应用
,特别涉及一种目标评论确定方法及装置。
技术介绍
随着网络应用技术的不断发展,越来越多的信息通过网络进行传播。为了增进接收网络信息的用户之间的交互,网络信息的提供商通常还会提供评论区域,以便用户对网络信息发布评论。面对日益增长的用户评论,如何快速筛选出优质的精彩评论,已经成为网络信息的提供商所需要解决的一个通用难题。在互联网络中,每个可评论的网络信息可以称为一个网络对象,比如,一个视频、一篇文章或者一部连载小说等等。在相关技术中,对于一个网络对象,该网络对象的提供商通常根据用户对评论的操作行为(比如点赞)来确定其中的精彩评论。比如,以确定某一部连载小说的精彩评论为例,服务器可以统计该连载小说的各个评论被点赞的次数,并将其中被点赞次数最多的几条(比如5条)评论确定为精彩评论。后续在展示目标对象的评论时,这些被点赞次数最多的几条评论将被优先展示。然而在实际应用中,用户对某条评论点赞可能并不是因为该条评论很精彩,比如,评论中的某个笑话段子可能得到很多人的点赞,或者,连载小说中一条催作者更新的评论也会引起很多读者的共鸣导致很多人点赞。上面这类评论并不适合优先展示,因此,相关技术中根据用户对评论的操作行为来确定其中的精彩评论的方式,确定出的精彩评论的准确性较低。
技术实现思路
为了解决现有技术中根据用户对评论的操作行为来确定其中的精彩评论的方式的准确性较低的问题,本专利技术实施例提供了一种目标评论确定方法及装置,技术方案如下:第一方面,提供了一种目标评论确定方法,所述方法包括:获取针对网络对象的至少两条备选评论;对所 ...
【技术保护点】
1.一种目标评论确定方法,其特征在于,所述方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。
【技术特征摘要】
1.一种目标评论确定方法,其特征在于,所述方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。2.根据权利要求1所述的方法,其特征在于,所述对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,包括:对于所述至少两条备选评论中的每一条备选评论,分析所述备选评论的文本内容,获得所述备选评论的特征向量,所述特征向量中的元素包括预设的特征词在所述备选评论中出现的次数、所述备选评论的字数以及所述备选评论中的标点符号数中的至少一种;获取包含所述特征向量的所述备选评论的特征信息。3.根据权利要求2所述的方法,其特征在于,在分析所述备选评论的文本内容,获得所述备选评论的特征向量之前,所述方法还包括:获取所述网络对象的各条评论,所述各条评论预先各自被标注为目标评论或者非目标评论;对所述各条评论的文本内容进行分词,获得所述各条评论中的各个实体词;对所述各个实体词进行卡方检验,获得所述各个实体词各自对应的卡方值,所述卡方值用于指示包含对应的实体词的评论是目标评论的概率;根据所述各个实体词各自对应的卡方值,从所述各个实体词中确定出所述预设的特征词。4.根据权利要求1所述的方法,其特征在于,所述获取网络对象的至少两条备选评论,包括:将所述网络对象的各条评论中,满足预设的第一筛选条件的评论获取为筛选后的至少两条评论;所述第一筛选条件包括评论中不包含预设的敏感词、评论中不包含指定内容文本以及评论字数大于预设的字数阈值中的至少一种;获取所述筛选后的至少两条评论的用户行为数据,所述用户行为数据用于指示用户对所述至少两条评论的操作行为;根据所述筛选后的至少两条评论的用户行为数据计算所述筛选后的至少两条评论各自对应的用户评价分值;根据所述筛选后的至少两条评论各自对应的用户评价分值获取所述至少两条备选评论。5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论,包括:将所述至少两条备选评论中,满足预设的第二筛选条件的评论获取为筛选后的备选评论,所述第二筛选条件包括对应的评分数值不小于预设的评分阈值;当所述筛选后的备选评论的数量不大于N时,将所述筛选后的备选评论确定为所述目标评论;当所述筛选后的备选评论的数量大于N时,获取所述筛选后的备选评论各自的发布时间,根据所述筛选后的备选评论各自的发布时间对所述筛选后的备选评论各自对应的评分数值进行调整,获得所述筛选后的备选评论调整后的评分数值,按照对应的调整后的评分数值从高到低的顺序对所述筛选后的备选评论进行排序,并将排在前N位的评论获取为所述目标评论;其中,N为预设的正整数。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取评论样本,所述评论样本是针对所述网络对象的评论中,被确定为满足目标评论的标准的样本;对所述评论样本进行特征提取,获得所述评论样本的特征信息;按照预设的机器训练算法对所述评论样本的特征信息进行机器训练,获得所述训练模型。7.根据权利要求6所述的方法,其特征在于,所述获取评论样本,包括:接收至少两个评论样本集,所述至少两个评论样本集分别由不同的用户选择出的评论所组成;将所述至少两个评论样本集的交集中包含的评论获取为所述评论样本。8.一种目标评论确定装置,其特征在于,所述装置包括:第一评论获取模块,用于获取针对网络对象的至少两条备选评论;特征提取模块,用于对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征...
【专利技术属性】
技术研发人员:荆宁,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。