用于处理评论的方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:22974687 阅读:24 留言:0更新日期:2019-12-31 23:25
根据本公开内容的示例性实现方式,提供了一种用于处理评论的方法。在该方法中,响应于接收到用户针对第一资讯源中的资讯输入的评论,提取所述评论的有效部分。基于预定签名规则获取所述有效部分的签名。确定所述签名在评论数据库中的出现频率,所述评论数据库包括在针对所述第一资讯源以及不同于所述第一资讯源的第二资讯源中的多个资讯的历史评论的签名。继而,基于所述出现频率来处理所述评论。根据本公开内容的示例性实现方式,还提供了用于处理评论的装置、设备和计算机存储介质。

Methods, devices, devices, and computer-readable storage media for processing comments

【技术实现步骤摘要】
用于处理评论的方法、装置、设备和计算机可读存储介质
本公开内容的实现方式概括地涉及评论处理,并且更具体地,涉及用于针对资讯源中的资讯的评论进行处理的方法、装置、设备和计算机存储介质。
技术介绍
随着信息技术和互联网的飞速发展,在线资讯越来越受到人们的欢迎,并且已经成为人们日常生活中获取信息的一种主要的途径。人们可以通过多种资讯源(例如,新闻网站或者提供新闻的应用等),来获取资讯。目前,互联网中每时每刻可能涌现出上亿甚至更多的资讯。当某资讯是有关重大新闻的资讯时,该资讯的阅读量将达到数百万次甚至更多。资讯源的用户经常会针对这些资讯发表自己的评论。此时,评论将与资讯本身一起被显示。然而,在评论中可能会存在例如广告、脏话或者其他不良信息。当资讯成为热点资讯时,评论同样可以获得极高的阅读量,因而导致不良信息被广泛传播。此时,如何处理资讯并且过滤包括不良信息的资讯,成为一个研究热点。因而,期望能够提供一种以更为方便并且有效的方式来处理评论的技术方案。
技术实现思路
根据本公开内容的示例实现方式,提供了一种用于处理评论的方案。<本文档来自技高网...

【技术保护点】
1.一种用于处理评论的方法,包括:/n响应于接收到用户针对第一资讯源中的资讯输入的评论,提取所述评论的有效部分;/n基于预定签名规则获取所述有效部分的签名;/n确定所述签名在评论数据库中的出现频率,所述评论数据库包括在针对所述第一资讯源以及不同于所述第一资讯源的第二资讯源中的多个资讯的历史评论的签名;以及/n基于所述出现频率来处理所述评论。/n

【技术特征摘要】
1.一种用于处理评论的方法,包括:
响应于接收到用户针对第一资讯源中的资讯输入的评论,提取所述评论的有效部分;
基于预定签名规则获取所述有效部分的签名;
确定所述签名在评论数据库中的出现频率,所述评论数据库包括在针对所述第一资讯源以及不同于所述第一资讯源的第二资讯源中的多个资讯的历史评论的签名;以及
基于所述出现频率来处理所述评论。


2.根据权利要求1所述的方法,其中基于所述出现频率来处理所述评论包括:
响应于确定所述出现频率高于预定义的阈值,删除所述评论;以及
基于所述签名更新所述评论数据库。


3.根据权利要求2所述的方法,其中所述出现频率包括以下中的至少任一项:
所述签名在所述评论数据库中出现的次数;以及
所述签名在所述评论数据库中与给定资讯的评论相关联的出现的次数。


4.根据权利要求2所述的方法,其中基于所述出现频率来处理所述评论进一步包括:
基于所述评论更新用于定义将被过滤的敏感内容的词典。


5.根据权利要求1所述的方法,进一步包括:
将所述有效部分与定义将被过滤的敏感内容的词典进行比较以确定所述有效部分是否包括将被过滤的敏感内容;以及
响应于确定所述有效部分不包括将被过滤的敏感内容,基于所述预定签名规则获取所述有效部分的所述签名。


6.根据权利要求1所述的方法,进一步包括:
响应于确定所述有效部分包括将被过滤的敏感关内容,删除所述评论。


7.根据权利要求1所述的方法,其中提取所述评论的所述有效部分包括以下中的至少任一项:
标点符号处理、表情符号处理、繁体字处理、重复内容处理、乱码处理、以及内容关键字处理。


8.根据权利要求1所述的方法,进一步包括:
获取预定义的情感关键字数据库,所述情感关键字数据库定义分别表示支持、反对以及中立情感的关键字;
比较从所述评论中提取的一个或多个关键字以及所述情感关键字数据库;以及
基于所述比较来确定所述评论表达的情感。


9.根据权利要求1所述的方法,进一步包括:
从所述评论中提取句子主干;以及
基于所述句子主干提取所述评论的观点。


10.根据权利要求1所述的方法,进一步包括:
获取基于历史评论来训练的优质评论模型;以及
基于所述优质评论模型来评价所述评论。


11.一种用于处理评论的装置,包括:
提取模块,配置用于响应于接收到用户针对第一资讯源中的资讯输入的评论,提取所述评论的有效部分;
获取模块,配置用于基于预定签名规则获取所述有效部分的签名;
确定模块,配置用于确定所述签名在评论数据库中的出现频率,所述评论数据库包括在针对所述第一资讯源以及不同于所述第一资讯源的第二资讯源中的多...

【专利技术属性】
技术研发人员:施茜陈思姣刁世亮罗雨
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1