一种实体权重评分方法、系统、电子设备及存储介质技术方案

技术编号:27514428 阅读:64 留言:0更新日期:2021-03-02 18:46
本发明专利技术提出一种实体权重评分方法、系统、电子设备及存储介质,其方法技术方案包括标准库建立步骤,设立一标准库,在所述标准库中设定标准实体属性、标准情感状态、所述标准情感状态的权重值;数据获取步骤,获取电商平台上一商品的原始评价数据;数据预处理步骤,将所述原始评价数据进行冗余信息过滤,并进行分词处理;实体处理步骤,对所述预处理后的原始评价数据进行实体级别处理,并根据所述实体级别处理结果建立一实体情感对应表;评分步骤,根据所述实体情感对应表、所述标准库计算商品的分值。本发明专利技术可以解决现有实体权重评分方法对情感状态利用不足、不科学问题。不科学问题。不科学问题。

【技术实现步骤摘要】
一种实体权重评分方法、系统、电子设备及存储介质


[0001]本专利技术属于自然语言处理领域,尤其涉及一种实体权重评分方法、系统、电子设备及存储介质。

技术介绍

[0002]人们在线上、线下购买的商品都可以在互联网上发表使用感受,并带有他们情感状态,通过捕捉这些数据可以获取大众对实体的反馈,并给予一定的评分,使得商品生产者、广告投放者在广告投放、实体性能改进方面能够有的放矢。但是由于数据量的巨大,单纯的靠人工整理数据比较繁琐,耗时时间长,需要大量的人力财力,同时,在评分过程中由于人工主观情感的影响造成评分的非客观性。
[0003]互联网中的商品评价错综复杂,涉及到的实体及实体属性的评价都可能会在评价数据中呈现出来,现有的技术大部分都是通过对日志采集,然后对用户-实体分析及用户的日常行为作出预测用来进行实体推荐,或者是通过分析评价日志,给评价打出是正向评价还是负评价的标签,而不是通过实体及其属性的权重进行评分,达到有针对性的优化产品的目的。并且目前对于实体评分这方面往往都是通过简单的人工处理,主观评分,存在误差性、人工耗时长等弊端。

技术实现思路

[0004]本申请实施例提供了一种实体权重评分方法、系统、电子设备及存储介质,以至少解决现有实体权重评分方法处理数据过程的繁琐、人工处理耗时长,评分由于没有标准,同时缺乏对实体属性的评价数据的统计造成评分具有差异性的、片面性的的问题。
[0005]第一方面,本申请实施例提供了一种实体权重评分方法,包括:标准库建立步骤,设立一标准库,在所述标准库中设定标准实体属性、标准情感状态、所述标准情感状态的权重值;数据获取步骤,获取电商平台上一商品的原始评价数据;数据预处理步骤,将所述原始评价数据进行冗余信息过滤,并进行分词处理;实体处理步骤,对所述预处理后的原始评价数据进行实体级别处理,并根据所述实体级别处理结果建立一实体情感对应表;评分步骤,根据所述实体情感对应表、所述标准库计算商品的分值。
[0006]优选的,所述实体处理步骤包括:实体标注步骤,标注所述原始评价数据中的实体及实体属性,并获取所述实体属性的情感状态;属性匹配步骤,对比所述实体属性与所述标准库中的标准实体属性,当相似度达一阈值时,判定为实体属性相似,并记录该匹配到的标准实体属性;情感匹配步骤,对比所述实体属性的情感状态与所述标准库中的标准情感状态,当相似度达一阈值时,判定为情感状态相似,并记录该匹配到的标准情感状态;对应表建立步骤,将所述实体、所述实体对应的标准实体属性、标准情感状态建立为一实体情感对应表。
[0007]优选的,所述实体属性标注通过一LSTM-CRF模型实现。
[0008]优选的,所述相似度匹配通过余弦相似度匹配实现。
[0009]第二方面,本申请实施例提供了一种实体权重评分系统,适用于上述一种实体权重评分方法,包括:标准库建立单元,包括一标准库,在所述标准库中设定标准实体属性、标准情感状态、所述标准情感状态的权重值;数据获取单元,获取电商平台上一商品的原始评价数据;数据预处理单元,将所述原始评价数据进行冗余信息过滤,并进行分词处理;实体处理单元,对所述预处理后的原始评价数据进行实体级别处理,并根据所述实体级别处理结果建立一实体情感对应表;评分单元,根据所述实体情感对应表、所述标准库计算商品的分值。
[0010]在其中一些实施例中,所述实体处理单元包括:实体标注模块,标注所述原始评价数据中的实体及实体属性,并获取所述实体属性的情感状态;属性匹配模块,对比所述实体属性与所述标准库中的标准实体属性,当相似度达一阈值时,判定为实体属性相似,并记录该匹配到的标准实体属性;情感匹配模块,对比所述实体属性的情感状态与所述标准库中的标准情感状态,当相似度达一阈值时,判定为情感状态相似,并记录该匹配到的标准情感状态;对应表建立模块,将所述实体、所述实体对应的标准实体属性、标准情感状态建立为一实体情感对应表。
[0011]在其中一些实施例中,所述实体属性标注通过一LSTM-CRF模型实现。
[0012]在其中一些实施例中,所述相似度匹配通过余弦相似度匹配实现。
[0013]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种实体权重评分方法。
[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的一种实体权重评分方法。
[0015]相比于相关技术,本申请实施例提供的一种实体权重评分方法通过对商品的评价数据通过使用LSTM-CRF模型对实体进行标注解决了传统人工标注的繁琐及客观性,极大节省了人工成本,同时,将模型结果根据现有的标准库使用相似度匹配,使的属性标准化,最后使用权重评分机制生成实体及其属性的最终评分,让实体评分根据其属性的重要性作为影响其评分的指标,减少了片面性的获取商品评论态度的可能性,最终将评分结果反馈给商品的品牌广告主,给他们在实体性能提高及广告投入方面提供指导方向。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1为本专利技术的实体权重评分方法流程图;
[0018]图2为图1中步骤S4的分步骤流程图;
[0019]图3为本专利技术的实体权重评分系统的框架图;
[0020]图4为本专利技术的电子设备的框架图;
[0021]以上图中:
[0022]1、标准库建立单元;2、数据获取单元;3、数据预处理单元;4、实体处理单元;5、评分单元;41、实体标注模块;42、属性匹配模块;43、情感匹配模块;60、总线;61、处理器;62、存储器;63、通信接口。
具体实施方式
[0023]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
[0025]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体权重评分方法,其特征在于,包括:标准库建立步骤,设立一标准库,在所述标准库中设定标准实体属性、标准情感状态、所述标准情感状态的权重值;数据获取步骤,获取电商平台上一商品的原始评价数据;数据预处理步骤,将所述原始评价数据进行冗余信息过滤,并进行分词处理;实体处理步骤,对所述预处理后的原始评价数据进行实体级别处理,并根据所述实体级别处理结果建立一实体情感对应表;评分步骤,根据所述实体情感对应表、所述标准库计算商品的分值。2.如权利要求1所述的实体权重评分方法,其特征在于,所述实体处理步骤包括:实体标注步骤,标注所述原始评价数据中的实体及实体属性,并获取所述实体属性的情感状态;属性匹配步骤,对比所述实体属性与所述标准库中的标准实体属性,当相似度达一阈值时,判定为实体属性相似,并记录该匹配到的标准实体属性;情感匹配步骤,对比所述实体属性的情感状态与所述标准库中的标准情感状态,当相似度达一阈值时,判定为情感状态相似,并记录该匹配到的标准情感状态;对应表建立步骤,将所述实体、所述实体对应的标准实体属性、标准情感状态建立为一实体情感对应表。3.如权利要求1或2所述的实体权重评分方法,其特征在于,所述实体属性标注通过一LSTM-CRF模型实现。4.如权利要求1或2所述的实体权重评分方法,其特征在于,所述相似度匹配通过余弦相似度匹配实现。5.一种实体权重评分系统,包括:标准库建立单元,包括一标准库,在所述标准库中设定标准实体属性、标准情感状态、所述标准情感状态的权重值;数据获取单元,获取电商平台上一商品的...

【专利技术属性】
技术研发人员:张靖南
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1