信息处理方法和装置制造方法及图纸

技术编号:15639341 阅读:66 留言:0更新日期:2017-06-15 22:55
本发明专利技术实施例公开了一种信息处理方法和装置,其中,方法包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。本发明专利技术实施例可以使用户可以全面了解汽车的评价信息。

【技术实现步骤摘要】
信息处理方法和装置
本专利技术涉及互联网技术,尤其是一种信息处理方法和装置。
技术介绍
当前,汽车已成为大众出行、货物运输的主要运载工具。针对各种品牌、型号的汽车,互联网上存在并不断涌现海量的评价信息,如何快速获取这些互联网上对汽车的评价信息并对其进行分析研究,对汽车生产厂商和行业研究人员而言,都是一项具有巨大挑战、但却非常有价值的工作。对汽车厂商而言,可以从用户的评论信息中掌握其产品的使用优缺点、以及在市场上的评价排序。同时,汽车口碑对消费者也非常重要,为消费者选择汽车品牌、型号提供了参考。在实现本专利技术的过程中,专利技术人发现,现有技术中,尚不存在一种全面了解汽车口碑的方式,汽车厂商、行业研究人员、消费者只能针对特定品牌、型号的汽车,从各汽车论坛搜索其评价信息,信息了解不全面,信息获取效率低下。
技术实现思路
本专利技术实施例所要解决的一个技术问题是:提供一种信息处理方法和装置,以使用户可以全面了解汽车的评价信息。根据本专利技术实施例的一个方面,提供的一种信息处理方法,包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。在本专利技术另一实施例的信息处理方法中,还包括获取所述爬取规则的操作;所述爬取规则具体为基于用户对互联网上指定产品的用户评述信息进行分析后设定的关键词设置的爬取标准;所述关键词包括指定产品的指标参数。在本专利技术另一实施例的信息处理方法中,所述从互联网爬取指定产品的用户评述信息包括:利用网络爬虫,对第三方平台网站的口碑专栏里的任意一个或多个版块进行定向爬取,获得用户评述信息;所述口碑专栏里的版块包括:车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置、油耗。在本专利技术另一实施例的信息处理方法中,还包括:响应于检测到新建语料包,对新建语料包进行学习,形成所述信息判断模型;所述语料包基于对各种评价等级的特征的总结形成,所述特征包括关键词和/或关键句型;或者响应于检测到语料包被更新,对更新后的语料包进行学习,并对所述信息判断模型进行更新。在本专利技术另一实施例的信息处理方法中,所述获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级包括:获取用户评述信息中各特征对应的评价等级,所述特征包括关键词和/或关键句型;响应于所述用户评述信息中包含同时对应多个不同评价等级的无效特征,去除同时对应多个不同评价等级的无效特征;对所述用户评述信息中特征去除无效特征后得到的各有效特征分别标注相应的评价等级。在本专利技术另一实施例的信息处理方法中,所述将标注评价等级的用户评价信息存储到信息系统中之前,还包括:根据分类要素对用户评述信息进行分类,获得用户评述信息的类别;所述指定产品为汽车时,所述分类要素包括车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置与油耗中的任意一种或多种;所述在信息系统中存储所述指定产品及其标注评价等级的用户评价信息包括:根据用户评述信息的类别,在信息系统中的相应位置存储所述指定产品及其标注评价等级的用户评价信息。在本专利技术另一实施例的信息处理方法中,所述获取用户评述信息对应的评价等级之后,还包括:判断是否获取到用户评述信息对应的评价等级;响应于获取到用户评述信息对应的评价等级,执行所述对用户评论信息标注获取到的评价等级的操作;否则,响应于未获取到用户评述信息对应的评价等级,输出未获取到评价等级的用户评述信息,并接收用户针对未获取到评价等级的用户评述信息反馈的评价等级;对未获取到评价等级的用户评述信息标注用户反馈的评价等级。在本专利技术另一实施例的信息处理方法中,基于预先设置的爬取周期或用户输入的爬取指令,执行所述基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息的操作。根据本专利技术实施例的另一个方面,提供的一种信息处理装置,包括:获取单元,用于基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;标注单元,用于根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;存储处理单元,用于在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。在本专利技术另一实施例的信息处理装置中,还包括:第一存储单元,用于存储所述爬取规则;所述爬取规则具体为基于用户对互联网上指定产品的用户评述信息进行分析后设定的关键词设置的爬取标准;所述关键词包括指定产品的指标参数。基于本专利技术上述实施例提供的信息处理方法和装置,基于预先设置的爬取规则,从互联网爬取指定产品(例如但不限于汽车)的用户评述信息;根据预先获得的信息判断模型,分别获取各用户评述信息对应的评价等级并对其标注评价等级,之后,将标注评价等级的用户评价信息汇总到信息系统中,通过信息系统全面收录指定产品各种评价等级的用户信息,形成了一个用户口碑评价体系,使用户从信息系统可以方便、全面地查询产品各方面的口碑信息,解决了现有技术用户对产品信息了解不全面、信息获取效率低下等问题,为产品厂商、行业研究人员、消费者提供了诸多便利。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明构成说明书的一部分的附图描述了本专利技术的实施例,并且连同描述一起用于解释本专利技术的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本专利技术,其中:图1为本专利技术信息处理方法一个实施例的流程图。图2为本专利技术实施例中形成语料包的一个实施例的流程图。图3为本专利技术信息处理方法另一个实施例的流程图。图4为本专利技术信息处理装置一个实施例的结构示意图。图5为本专利技术信息处理装置另一个实施例的结构示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。图1为本专利技术信息处理方法一个实施例的流程图。如图1所示,该实施例的信息处理方法包括:102,基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息。本专利技术实施例中的指定产品例如可以是汽车、电动车、手机终端、房产等任意产品。104,根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级。其中的评价等级用于反映用户对该指定产品的评价,例如根据用户对产品的评价好坏可以将评价等级分为包括正性(+1)、中性(0)、负性(-1)三个评价等级,正性(+1)表示用户对该产品的评价为正面评价,中性(0)表示用户对该产品评价一般,不好不差,本文档来自技高网...
信息处理方法和装置

【技术保护点】
一种信息处理方法,其特征在于,包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。2.根据权利要求1所述的方法,其特征在于,还包括获取所述爬取规则的操作;所述爬取规则具体为基于用户对互联网上指定产品的用户评述信息进行分析后设定的关键词设置的爬取标准;所述关键词包括指定产品的指标参数。3.根据权利要求1或2所述的方法,其特征在于,所述从互联网爬取指定产品的用户评述信息包括:利用网络爬虫,对第三方平台网站的口碑专栏里的任意一个或多个版块进行定向爬取,获得用户评述信息;所述口碑专栏里的版块包括:车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置、油耗。4.根据权利要求1至3任意一项所述的方法,其特征在于,还包括:响应于检测到新建语料包,对新建语料包进行学习,形成所述信息判断模型;所述语料包基于对各种评价等级的特征的总结形成,所述特征包括关键词和/或关键句型;或者响应于检测到语料包被更新,对更新后的语料包进行学习,并对所述信息判断模型进行更新。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级包括:获取用户评述信息中各特征对应的评价等级,所述特征包括关键词和/或关键句型;响应于所述用户评述信息中包含同时对应多个不同评价等级的无效特征,去除同时对应多个不同评价等级的无效特征;对所述用户评述信息中特征去除无效特征后得到的各有效特征分别标注相应的评价等级。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述将标注评价等级的用户评价信息存...

【专利技术属性】
技术研发人员:刘嘉钦滨杰
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1