评论信息确定方法、装置、服务器及存储介质制造方法及图纸

技术编号:16188144 阅读:46 留言:0更新日期:2017-09-12 11:24
本发明专利技术实施例公开了一种评论信息确定方法、装置、服务器及存储介质,该方法包括:获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。本方案使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

Comment information determining method, device, server and storage medium

The embodiment of the invention discloses a method for determining, device, server and storage medium a comment information, the method comprises: acquiring text comment, the comment on the event to determine the label according to the text content; the event will determine the label and comment on the spectra in tags are compared, determined on the basis of the comparison results of the candidate comments, comments of other events generated by the comments and the corresponding comments, the comment contains a comment map and the corresponding comment tags; the candidate comments screening, will meet the preset conditions to determine the candidate comment on the comment comment information. This scheme makes the correlation between the comment information and the comment event more strong, and the evaluation of the comment information is more intelligent and more efficient.

【技术实现步骤摘要】
评论信息确定方法、装置、服务器及存储介质
本专利技术实施例涉及计算机技术,尤其涉及一种评论信息确定方法、装置、服务器及存储介质。
技术介绍
随着人工智能技术的飞速发展,如何让机器能拥有和人类一样的智能成为当下研究的热点课题。在该背景下,人们希望机器能够读懂一篇文章,并且能够给出有自己观点的评论,或者给出互联网用户对这篇文章的一般性观点。现有技术中,通过传统的信息检索技术,基于评论事件的关键词索引出相关评论事件的评论,并基于评论事件之间的相关性给出当前评论事件的评论信息。该方案的缺陷在于,评论信息严重同质化且相关性较差,评论信息的智能化程度低,效率低下。
技术实现思路
本专利技术提供了一种评论信息确定方法、装置、服务器及存储介质,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。第一方面,本专利技术实施例提供了一种评论信息确定方法,包括:获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。第二方面,本专利技术实施例还提供了一种评论信息确定装置,包括:事件标签确定模块,用于获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;候选评论确定模块,用于将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;评论信息确定模块,用于对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。第三方面,本专利技术实施例还提供了一种服务器,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述评论信息确定方法。第四方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种评论信息确定方法,该方法包括:获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。本专利技术实施例提供的技术方案,通过获取评论事件的文本内容,依据文本内容确定评论事件的事件标签,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论后在最终从候选评论中得到评论信息用以对评论事件进行评论,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1A是本专利技术实施例提供的一种评论信息确定方法的流程图;图1B是本专利技术实施例提供的一种评论信息确定方法过程中利用到的评论图谱的示意图;图2是本专利技术实施例提供的另一种评论信息确定方法的流程图;图3是本专利技术实施例提供的另一种评论信息确定方法的流程图;图4是本专利技术实施例提供的另一种评论信息确定方法的流程图;图5本专利技术实施例提供的评论信息确定装置的结构框图;图6是本专利技术实施例提供的一种服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。图1A是本专利技术实施例提供的一种评论信息确定方法的流程图,本实施例可适用于自动对评论事件进行评论的情况,该方法可由计算设备如服务器来执行,如图1A所示,本实施例提供的具体方案如下:S101、获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签。在一个实施例中,评论事件可以是新闻事件、微信公众号文章、微博、博客等,其中,评论事件的文本内容为该事件的文字内容,该文字内容可以是描述一个具体的新闻事件,还可以是对某个明星、人物的描写,还可以是对某个地点(如风景名胜景点)的记录、描写,本实施例不做限定。本方案中,可自动生成评论信息以对该评论事件进行评论。示例性的,如张三通过微信公众号发布了一篇关于名人A的娱乐八卦文章,则通过本方案可自动形成针对该八卦文章的评论信息。具体的,可通过网络爬虫爬取到张三发布的娱乐八卦文章的网站网页,通过获取到的网页内容确定出评论事件(即这篇八卦文章)的文本内容。其中,事件标签表征了评论事件的报道对象、地点、具体发生的事情等,示例性的,评论事件为一篇网页新闻,网址为:http://news.youth.cn/jsxw/201702/t20170224_12345678.htm,主要报道内容是名人A晒的老年妆的照片,则相应的,该评论事件的事件标签可以被确定为“名人A”、“晒”、“老年妆”、“照片”。在一个实施例中,依据评论事件的文本内容确定对应的事件标签的过程可以是:首先,对文本内容进行预处理,得到对应的词语集合。示例性的,通过对文本内容进行基于语义、语法的识别和断句,将文本内容表述的自然语言分断为过个单独的词语。举例而言,评论事件的文本内容为“搜狐娱乐讯23日晚,名人A晒出一张自己老年妆的照片,照片中,名人A头发花白卷曲,架着一副老花镜,穿着羊毛开衫,驼着背。名人A配文:多期盼能陪你老去。我可能改变了命运,因为你回来了。岁月可能留不下美丽的容颜,但能这样和爱的人一起老去,也挺好的。”对应的,得到的词语的集合可以是“搜狐、娱乐、名人A、晒、老年妆、照片...”。在确定出评论事件文本内容对应的词语集合后,通过预设学习模型确定所述词语集合中词语的权重值,将满足条件的权重值对应的词语确定为所述评论事件的事件标签。具体的,该预设学习模型由SVM(SupportVectorMachine,支持向量机)通过对词语在词语集合中出现的次数、位置、是否为专业名词、是否出现在标题中等多个特征维度学习训练得到,其中,该预设学习模型可预先学习得到,在需要确定评论事件的事件标签时,用于确定得到的词语集合中词语的权重值,示例性的,词语集合中,词语“名人A”出现了3次,且出现在了评论事件标题中,则词语“名人A”的权重值最高,其中词语“照片”出现了两次,且也出现在标题中权重值也较高,词语“搜狐”出现一次,出现频率较低,且非标题中的词语,则相应的词语“搜狐”的权重值较低。通过确定出的词语的权重值来最终确定合适的事件标签,具体的,可按照权重值的高低又高到低对词语进行排序,根据词语集合中词语的数量以及欲得到的事件标签的数量选取合适的百分比例,将排名靠前的词语确定为事件标签。S102、将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。在一个实施例中,评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评本文档来自技高网...
评论信息确定方法、装置、服务器及存储介质

【技术保护点】
一种评论信息确定方法,其特征在于,包括:获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

【技术特征摘要】
1.一种评论信息确定方法,其特征在于,包括:获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。2.根据权利要求1所述的方法,其特征在于,依据所述文本内容确定所述评论事件的事件标签包括:对所述文本内容进行预处理,得到和所述文本内容对应的词语集合,所述词语集合中包含有至少两个词语;通过预设学习模型确定所述词语集合中词语的权重值,将满足条件的权重值对应的词语确定为所述评论事件的事件标签。3.根据权利要求2所述的方法,其特征在于,对所述文本内容进行预处理之前,还包括:在所述文本内容中抽取文本要素,所述文本要素包含至少两个关键词语;相应的,在将满足条件的权重值对应的词语确定为所述评论事件的事件标签之后,还包括:将包含所述事件标签的文本要素中的其它关键词语也确定为所述评论事件的事件标签。4.根据权利要求1所述的方法,其特征在于,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论包括:将确定出的事件标签和评论图谱中评论内容对应的评论标签进行比对,依据评论标签命中的事件标签的数量的大小,由高到低对所述评论内容进行排序,将排序靠前的评论内容作为候选评论。5.根据权利要求4所述的方法,其特征在于,对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息包括:将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息。6.根据权利要求4所述的方法,其特征在于,所述评论事件包括新闻事件,相应的,在将满足预设条件的候选评论确定为所述评论事件的评论信息之后,还包括:确定所述新闻事件的情感逻辑,依据所述情感逻辑选择符合条件的评论信息对所述新闻事件进行评论。7.根据权利要求1-6中任一项所述的方法,其特征在于,评论图谱由其它评论事件以及对应的评论内容生成的过程包括:通过网络爬虫定向抓取并确定评论内容;通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点;依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签;将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱。8.一种评论信息确定装置,其特征在于,包括:事件标签确定模块,用于获取评论事件的文本内容,依据所述文本内容确...

【专利技术属性】
技术研发人员:时迎超和为佘俏俏崔建青周湘阳郑俊强
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1