一种舆情信息提取方法、装置、终端设备及存储介质制造方法及图纸

技术编号:16644645 阅读:72 留言:0更新日期:2017-11-26 17:03
本发明专利技术公开了一种舆情信息提取方法,包括以下步骤:获取商品的第一评论语句;根据优先级语料库对所述第一评论语句进行分词;调用停用词语料库去除分词后的所述第一评论语句中的停用词,得到包括至少一个分词的第二评论语句;基于每个分词的类型及分词之间的顺序关系,从所述第二评论语句中提取出至少一个评论结构;根据提取的所述评论结构获取所述商品的评价情况。本发明专利技术还提供了一种舆情信息提取装置、终端设备及计算机可读存储介质,多维度挖掘提取评论数据,为商家提供准确直观地数据信息,为商家制定并调整后续运营决策提供参考。

Method, device, terminal equipment and storage medium for extracting public opinion information

The invention discloses a method for extracting information of public opinion, which comprises the following steps: first to comment on the statement to obtain goods; according to the priority of corpus segmentation on the first comment statements; call stop words corpus removal the word after the first comment statement of stop words, including at least one of the second word review sentences; the relationship between the type and order of each word segmentation based on comments from the second statement to extract at least one comment structure; according to the evaluation the comment structure extraction to obtain the goods situation. The invention also provides a public opinion information extraction device, a terminal device and a computer readable storage medium, and extracts the comment data in a plurality of dimensions to provide accurate and visual data information for the merchant, and provides reference for the merchant to formulate and adjust the follow-up operation decision.

【技术实现步骤摘要】
一种舆情信息提取方法、装置、终端设备及存储介质
本专利技术涉及计算机领域,尤其涉及一种舆情信息提取方法、装置、终端设备及存储介质。
技术介绍
电子商务行业发展迅猛,对社会和经济的重要性与日俱增。随着互联网的普及,人们越来越依赖于诸如天猫、淘宝、京东等电商平台进行购物。大型电商平台是电子商务行业发展的催化剂。对比传统线下销售的厂商,从购物用户的角度,在电商平台上可以十分详尽地获取到商品的属性、销量等信息,还可以通过已购买过的用户做出的评价,进一步的了解商品的使用情况,从而做出购买与否的选择。而对商家来说,收集消费者对线下销售产品的评价信息成本非常高,电商平台则提供了这样一个利于用户反馈的环境。在线评论对消费者做出消费决策具有参考意义。据美国权威调查咨询公司——KRC研究所在2005年所做的一项调查表明,通过网络进行购物的用户进行在线搜索和评价商品时,会参考其他消费者对目标商品的评价与使用心得,评论数据很大程度上影响了他们的购物决策。根据中国互联网络信息中心(CNNIC)在2009年调查发布的《中国互联网络发展状况统计报告》显示,在线商品的评论是我国消费者“网购”购买决策的重要信息来源之本文档来自技高网...
一种舆情信息提取方法、装置、终端设备及存储介质

【技术保护点】
一种舆情信息提取方法,其特征在于,包括以下步骤:获取商品的第一评论语句;根据优先级语料库对所述第一评论语句进行分词;调用停用词语料库去除分词后的所述第一评论语句中的停用词,得到包括至少一个分词的第二评论语句;基于每个分词的类型及分词之间的顺序关系,从所述第二评论语句中提取出至少一个评论结构;根据提取的所述评论结构获取所述商品的评价情况。

【技术特征摘要】
1.一种舆情信息提取方法,其特征在于,包括以下步骤:获取商品的第一评论语句;根据优先级语料库对所述第一评论语句进行分词;调用停用词语料库去除分词后的所述第一评论语句中的停用词,得到包括至少一个分词的第二评论语句;基于每个分词的类型及分词之间的顺序关系,从所述第二评论语句中提取出至少一个评论结构;根据提取的所述评论结构获取所述商品的评价情况。2.根据权利要求1所述的舆情信息提取方法,其特征在于,所述分词的类型包括商品维度词、商品情感词;所述评论结构包括商品维度NA结构和商品维度独立结构;则所述基于每个分词的类型及分词之间的顺序关系,从所述第二评论语句中提取出至少一个评论结构,具体包括:依次获取所述第二评论语句中的每个分词的类型;当判断当前分词的类型为商品维度词且该分词的下一个分词的类型为商品情感词时,将该分词及该分词的下一个分词作为一个商品维度NA结构;当判断当前分词的类型为商品情感词且该分词的上一个分词的类型不为商品维度词时,或者当判断该分词的类型为商品情感词且所述分词不存在上一个分词时,将该分词作为一个商品维度独立结构。3.根据权利要求2所述的舆情信息提取方法,其特征在于,所述根据提取的所述评论结构获取对应的商品的评价情况,具体包括:当所述评论结构为商品维度NA结构时,调用维度词语料库对所述商品维度词进行同义转换,调用情感词语料库对所述商品情感词进行等级转换,根据所述同义转换及所述等级转换的结果获取所述商品维度NA结构对应的商品的商品维度分数;当所述评论结构为商品维度独立结构时,调用维度情感词语料库对所述商品情感词进行商品维度判别及情感词等级转换,根据所述商品维度判别及情感词等级转换的结果获取所述商品维度独立结构对应的商品的商品维度分数。4.根据权利要求3所述的舆情信息提取方法,其特征在于,所述分词的类型还包括用户情感词、用户行为词;所述评论结构还包括用户行为NA结构、用户行为独立结构;则所述基于每个分词的类型及分词之间的顺序关系,从所述第二评论语句中提取出至少一个评论结构,具体包括:依次获取所述第二评论语句中的每个分词的类型;当判断当前分词的类型为用户行为词且该分词的下一个分词的类型为用户情感词时,将该分词及该分词的下一个分词作为一个用户行为NA结构;当判断当前分词...

【专利技术属性】
技术研发人员:张伟毅周荣海吕斌沈敏玲
申请(专利权)人:青木数字技术股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1