目标评论确定方法及装置制造方法及图纸

技术编号:19543926 阅读:19 留言:0更新日期:2018-11-24 20:38
本发明专利技术是关于一种目标评论确定方法及装置。该方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。该方法实现按照评论的文本内容选择目标评论,达到提高目标评论确定的准确性的效果。

Target comment determination method and device

The invention relates to a target comment determination method and device. The method includes: obtaining at least two alternative comments for network objects; extracting features of at least two alternative comments, obtaining respective feature information of at least two alternative comments, which is used to indicate the characteristics of the text content of the corresponding alternative comments; and extracting features of at least two alternative comments. Each feature information is input into the presupposed training model, and the corresponding score values of at least two alternative reviews are calculated. According to the corresponding score values of at least two alternative reviews, the target reviews in at least two alternative reviews are determined. This method can select target reviews according to the text content of the reviews, and improve the accuracy of target reviews.

【技术实现步骤摘要】
目标评论确定方法及装置
本专利技术涉及网络应用
,特别涉及一种目标评论确定方法及装置。
技术介绍
随着网络应用技术的不断发展,越来越多的信息通过网络进行传播。为了增进接收网络信息的用户之间的交互,网络信息的提供商通常还会提供评论区域,以便用户对网络信息发布评论。面对日益增长的用户评论,如何快速筛选出优质的精彩评论,已经成为网络信息的提供商所需要解决的一个通用难题。在互联网络中,每个可评论的网络信息可以称为一个网络对象,比如,一个视频、一篇文章或者一部连载小说等等。在相关技术中,对于一个网络对象,该网络对象的提供商通常根据用户对评论的操作行为(比如点赞)来确定其中的精彩评论。比如,以确定某一部连载小说的精彩评论为例,服务器可以统计该连载小说的各个评论被点赞的次数,并将其中被点赞次数最多的几条(比如5条)评论确定为精彩评论。后续在展示目标对象的评论时,这些被点赞次数最多的几条评论将被优先展示。然而在实际应用中,用户对某条评论点赞可能并不是因为该条评论很精彩,比如,评论中的某个笑话段子可能得到很多人的点赞,或者,连载小说中一条催作者更新的评论也会引起很多读者的共鸣导致很多人点赞。上面这类评论并不适合优先展示,因此,相关技术中根据用户对评论的操作行为来确定其中的精彩评论的方式,确定出的精彩评论的准确性较低。
技术实现思路
为了解决现有技术中根据用户对评论的操作行为来确定其中的精彩评论的方式的准确性较低的问题,本专利技术实施例提供了一种目标评论确定方法及装置,技术方案如下:第一方面,提供了一种目标评论确定方法,所述方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。第二方面,提供了一种模型训练方法,所述方法包括:获取评论样本,所述评论样本是针对网络对象的评论中,被确定为满足目标评论的标准的样本;对所述评论样本进行特征提取,获得所述评论样本的特征信息,所述特征信息用于指示所述评论样本的文本内容的特征;按照预设的机器训练算法对所述评论样本的特征信息进行机器训练,获得训练模型,所述训练模型用于在从针对网络对象的至少两条备选评论中确定目标评论时,根据所述至少两条备选评论各自的特征信息计算获得所述至少两条备选评论各自对应的评分数值。第三方面,提供了一种存储设备,所述存储设备中存储有多条指令,所述指令适于由处理器加载并执行:如上述第一方面所述的目标评论确定方法。本专利技术实施例提供的技术方案可以包括以下有益效果:在确定目标评论时,提取评论的文本内容对应的特征,并根据提取到的特征,结合预设的训练模型计算该评论的评分数值,并基于计算出的评分数值来确定该目标评论,从而实现按照评论的文本内容选择目标评论,达到提高目标评论确定的准确性的效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种网络评论管理系统的结构示意图;图2是根据一示例性实施例示出的一种目标评论确定方法的流程图;图3是根据一示例性实施例示出的一种精彩评论确定流程示意图;图4和图5是图3所示实施例涉及的精彩评论展示示意图;图6是根据一示例性实施例示出的一种模型训练方法的流程图;图7是图6所示的实施例涉及的一种获取评论样本的流程示意图;图8是根据一示例性实施例示出的一种目标评论确定装置的结构方框图;图9是根据一示例性实施例示出的一种模型训练装置的结构方框图;图10是根据一示例性实施例示出的一种服务器的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是本专利技术一示例性实施例示出的一种网络评论管理系统的结构示意图。该系统包括:若干个用户终端120和服务器集群140。用户终端120可以是手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。用户终端120与服务器集群140之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。服务器集群140是一台服务器,或者由若干台服务器,或者是一个虚拟化平台,或者是一个云计算服务中心。可选的,服务器集群140可以包括用于实现目标评论确定平台142的服务器,可选的,服务器集群140还包括用于实现网络评论管理平台144的服务器。可选的,服务器集群140还包括用于实现网络对象管理平台146的服务器。可选的,网络评论管理平台144包括:用于存储各个用户针对网络对象发布的评论的服务器、用于存储网络对象的各条评论对应的用户行为的服务器以及用于推送及维护目标评论的服务器。其中,评论对应的用户行为可以是用户对评论的点赞以及引用的用户行为。目标评论是目标评论确定平台142从各个用户针对网络对象发布的评论中确定出的至少一条评论。可选的,网络对象管理平台146用于维护以及向用户终端120推送网络对象,该网络对象包括但不限于电子书籍、网络文章、新闻、资讯、视频以及论坛帖子等允许读者或观众发表评论的网络内容。本专利技术实施例对于网络对象的具体形式不做限定。需要说明的是,上述用于实现目标评论确定平台142、网络评论管理平台144以及网络对象管理平台146的服务器可以是相互之间独立的服务器;或者,上述目标评论确定平台142、网络评论管理平台144以及网络对象管理平台146中的两个平台可以实现在同一个服务器中,而另外一个平台可以实现在另一个服务器中;或者,用户实现上述三个平台的服务器也可以是同一个服务器。当上述三个平台实现在两个或者三个服务器中时,这两个或者三个服务器之间通过通信网络相连。可选的,该系统还可以包括管理设备160(图1未示出),该管理设备160与服务器集群140之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(LocalAreaNetwork,LAN)、城域网(MetropolitanAreaNetwork,MAN)、广域网(WideAreaNetwork,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(HyperTextMark-upLanguage,HTM本文档来自技高网...

【技术保护点】
1.一种目标评论确定方法,其特征在于,所述方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。

【技术特征摘要】
1.一种目标评论确定方法,其特征在于,所述方法包括:获取针对网络对象的至少两条备选评论;对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,所述特征信息用于指示对应的备选评论的文本内容的特征;将所述至少两条备选评论各自的特征信息输入预设的训练模型,计算获得所述至少两条备选评论各自对应的评分数值;根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论。2.根据权利要求1所述的方法,其特征在于,所述对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征信息,包括:对于所述至少两条备选评论中的每一条备选评论,分析所述备选评论的文本内容,获得所述备选评论的特征向量,所述特征向量中的元素包括预设的特征词在所述备选评论中出现的次数、所述备选评论的字数以及所述备选评论中的标点符号数中的至少一种;获取包含所述特征向量的所述备选评论的特征信息。3.根据权利要求2所述的方法,其特征在于,在分析所述备选评论的文本内容,获得所述备选评论的特征向量之前,所述方法还包括:获取所述网络对象的各条评论,所述各条评论预先各自被标注为目标评论或者非目标评论;对所述各条评论的文本内容进行分词,获得所述各条评论中的各个实体词;对所述各个实体词进行卡方检验,获得所述各个实体词各自对应的卡方值,所述卡方值用于指示包含对应的实体词的评论是目标评论的概率;根据所述各个实体词各自对应的卡方值,从所述各个实体词中确定出所述预设的特征词。4.根据权利要求1所述的方法,其特征在于,所述获取网络对象的至少两条备选评论,包括:将所述网络对象的各条评论中,满足预设的第一筛选条件的评论获取为筛选后的至少两条评论;所述第一筛选条件包括评论中不包含预设的敏感词、评论中不包含指定内容文本以及评论字数大于预设的字数阈值中的至少一种;获取所述筛选后的至少两条评论的用户行为数据,所述用户行为数据用于指示用户对所述至少两条评论的操作行为;根据所述筛选后的至少两条评论的用户行为数据计算所述筛选后的至少两条评论各自对应的用户评价分值;根据所述筛选后的至少两条评论各自对应的用户评价分值获取所述至少两条备选评论。5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述至少两条备选评论各自对应的评分数值,确定所述至少两条备选评论中的目标评论,包括:将所述至少两条备选评论中,满足预设的第二筛选条件的评论获取为筛选后的备选评论,所述第二筛选条件包括对应的评分数值不小于预设的评分阈值;当所述筛选后的备选评论的数量不大于N时,将所述筛选后的备选评论确定为所述目标评论;当所述筛选后的备选评论的数量大于N时,获取所述筛选后的备选评论各自的发布时间,根据所述筛选后的备选评论各自的发布时间对所述筛选后的备选评论各自对应的评分数值进行调整,获得所述筛选后的备选评论调整后的评分数值,按照对应的调整后的评分数值从高到低的顺序对所述筛选后的备选评论进行排序,并将排在前N位的评论获取为所述目标评论;其中,N为预设的正整数。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取评论样本,所述评论样本是针对所述网络对象的评论中,被确定为满足目标评论的标准的样本;对所述评论样本进行特征提取,获得所述评论样本的特征信息;按照预设的机器训练算法对所述评论样本的特征信息进行机器训练,获得所述训练模型。7.根据权利要求6所述的方法,其特征在于,所述获取评论样本,包括:接收至少两个评论样本集,所述至少两个评论样本集分别由不同的用户选择出的评论所组成;将所述至少两个评论样本集的交集中包含的评论获取为所述评论样本。8.一种目标评论确定装置,其特征在于,所述装置包括:第一评论获取模块,用于获取针对网络对象的至少两条备选评论;特征提取模块,用于对所述至少两条备选评论进行特征提取,获得所述至少两条备选评论各自的特征...

【专利技术属性】
技术研发人员:荆宁
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1