信息权重的确定方法和装置制造方法及图纸

技术编号:14931978 阅读:56 留言:0更新日期:2017-03-31 13:53
本发明专利技术公开了一种信息权重的确定方法和装置,其中,信息权重的确定方法包括:获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分;以及分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。本发明专利技术实施例的信息权重的确定方法和装置,通过获取评论文本,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分,然后分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重,从而使评论文本中的条目信息能够更准确地反映用户的评论情况。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种信息权重的确定方法和装置
技术介绍
随着互联网技术的快速发展,针对同一事物或现象,人们可以自由地表达自己的观点,例如:用户在某家淘宝店铺购买商品时,可以对其发表评论,如物流快、质量好等,从而为其他用户在购物该商品时提供购买依据。对于大量的评论资源,其中包含有正面评价、负面评价等情感词,目前只是对这些情感词进行分类。由于每个用户对同一商品的使用感受或喜好程度并不一样,使用的情感词也不一样,在对用户的评论进行数据挖掘的时候,如果对“好”、“非常好”等情感词赋予相同的权重,则无法准确地反映出用户的评论情况。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种信息权重的确定方法,该方法能够使评论文本中的条目信息能够更准确地反映用户的评论情况。本专利技术的第二个目的在于提出一种信息权重的确定装置。为达上述目的,根据本专利技术第一方面实施例提出了一种信息权重的确定方法,包括:获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对应的评分;以及分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。本专利技术实施例的信息权重的确定方法,通过获取评论文本,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分,然后分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重,从而使评论文本中的条目信息能够更准确地反映用户的评论情况。为达上述目的,根据本专利技术第二方面实施例提出了一种信息权重的确定装置,包括:获取模块,用于获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;匹配模块,用于使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对应的评分;以及处理模块,用于分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。本专利技术实施例的信息权重的确定装置,通过获取评论文本,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分,然后分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重,从而使评论文本中的条目信息能够更准确地反映用户的评论情况。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1a为根据本专利技术一个实施例的信息权重的确定方法的流程图一。图1b为根据本专利技术一个实施例的信息权重的确定方法的流程图二。图2为根据本专利技术一个实施例的信息权重的确定装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的信息权重的确定方法和装置。图1a为根据本专利技术一个实施例的信息权重的确定方法的流程图。如图1a所示,该信息权重的确定方法包括:S101,获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分。在本专利技术的实施例中,服务器可接收客户端发送的获取请求,并基于获取请求获取预设对象的所有评论文本。其中,评论文本中可包含至少一个条目信息及其对应的评分。举例来说,预设对象为某家餐厅,其中,评论文本1“价格偏高,环境很不错,服务好”中,包含了“价格偏高”、“环境很不错”和“服务好”三个条目信息,且三个条目信息对应的评分均为3分;评论文本2“价格偏高,服务好”中,包含了“价格偏高”和“服务好”两个条目信息,且两个条目信息对应的评分均为4分;评论文本3“服务好”中,包含了“服务好”一个条目信息,且该条目信息对应的评分为3分。具体地,用户可通过客户端发送获取请求,服务器在接收到获取请求后,可基于获取请求返回预设对象的所有评论文本至客户端。S102,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分。具体地,在获取评论文本之后,由于评论文本的数据量巨大,因此可基于云梯集群,使用预设词表对评论文本进行文本匹配,以提高匹配效率。其中,云梯集群是一种分布式计算集群,其能够高效地完成海量数据的处理。在对评论文本进行文本匹配后,可获得与预设词表中的条目信息对应的评分。其中,预设词表中的条目信息可包括评论指标和与每个评论指标对应的预设词语。例如:评论指标可包括服务、环境、材质等,预设词语可包括好、非常好、不错等表示程度的词语。继续上一例子进行描述,假设预设词表中的条目信息为“服务好”,为了获得该条目信息对应的评分,可对所有评论文本进行文本匹配,获得所有包含“服务好”的评论文本,然后获得相应的评分,例如评论文本1中包含了“服务好”且该条目信息对应的评分为3分;评论文本2中包含了“服务好”且该条目信息对应的评分为4分;评论文本3中包含了“服务好”且该条目信息对应的评分为3分。S103,分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。具体地,可使用云梯集群分别对与每个条目信息对应的评分进行平均运算和归一化处理,最终确定对应条目信息的权重。继续上一例子进行描述,对上述三个评分进行处理,做平均运算,可算出条目信息“服务好”的平均分为(3+4+3)/3=3.3。由于“服务好”为正面评价,对其进行归一化处理,获得其权重为3.3。再例如:假设预设词表中的条目信息为“环境差”,评论文本1中包含了“环境差”且该条目信息对应的评分为1分;评论文本2中包含了“环境差”且该条目信息对应的评分为2分;评论文本3中包含了“环境差”且该条目信息对应的评分为1分,可计算出条目信息“环境差”的平均分为(1+2+1)/3=1.3。由于“环境差”为负面评价,对其进行归一化处理,获得其权重为5-1.3=3.7。应当理解的是,权重数值越大,表示程度越强烈。此外,如图1b所示,该信息权重的确定方法还可包括:S104,根据每个评论文本所包含的条目信息的权重计算对应评论文本的评分信息,并根据评分信息对评论文本进行排序,以及向客户端返回排序结果。在本专利技术的实施例中,在根据处理结果确定对应条目信息的权重之后,还可根据每个评论文本所包含的条目信息的权重计算对应评论文本本文档来自技高网...

【技术保护点】
一种信息权重的确定方法,其特征在于,包括:获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对应的评分;以及分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。

【技术特征摘要】
1.一种信息权重的确定方法,其特征在于,包括:
获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;
使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对
应的评分;以及
分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。
2.根据权利要求1所述的方法,其特征在于,在所述根据处理结果确定对应条目信息
的权重之后,还包括:
根据每个评论文本所包含的条目信息的权重计算对应评论文本的评分信息,并根据所
述评分信息对所述评论文本进行排序,以及向客户端返回排序结果。
3.根据权利要求2所述的方法,其特征在于,所述获取评论文本,包括:
接收所述客户端发送的获取请求,并基于所述获取请求获取预设对象的所有评论文本。
4.根据权利要求1所述的方法,其特征在于,所述使用预设词表对所述评论文本进行
文本匹配,包括:
使用预设词表基于云梯集群对所述评论文本进行文本匹配。
5.根据权利要求4所述的方法,其特征在于,所述分别对与每个条目信息对应的评分
进行处理,包括:
使用所述云梯集群分别对与每个条目信息对应的评分进行平均运算和归一化处理。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述预设词表中的条目信息包
括评论指标和与每个评论指标对应的预设词语。
7.根据权利要求2所述的方法,其特征在于,所述根据每个评论文本所包含的条目信
息的权重计算对应评论文本的评分信息,并根据所述评分信息对所述评论文本进行排序,
包括:
将每个评论文本所包含的条目信息的权重相加,获得对应评论文本的评分信息;以及

【专利技术属性】
技术研发人员:伍歆
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1