面向电商产品的评价对象识别方法、装置及存储介质制造方法及图纸

技术编号:25346568 阅读:40 留言:0更新日期:2020-08-21 17:05
本发明专利技术公开了一种面向电商产品的评价对象识别方法、装置及存储介质,其中方法包括以下步骤:将同一句子中的候选评价对象和候选评价词两两组成词对;采用词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合;从第二候选评价对象集合获取准确评价对象,结合第一候选评价对象集合和准确评价对象获得准确评价对象集合。本发明专利技术在对评价对象召回策略中,使用字词混合向量的相似度衡量评价对象间的语义相似度,提高了评价对象召回率和准确率,可应用于意见挖掘领域。

【技术实现步骤摘要】
面向电商产品的评价对象识别方法、装置及存储介质
本专利技术涉及意见挖掘领域,尤其涉及一种面向电商产品的评价对象识别方法、装置及存储介质。
技术介绍
随着互联网的快速兴起,电商产品平台也迎来了快速发展,目前被大众所知电商产品平台有淘宝、京东、拼多多和当当等等。电商平台的快速发展这意味着电商产品也变得更加多样化,且电商产品的内容也更为丰富。面对多样化、丰富化的电商产品,作为消费者,往往希望从平台侧面去了解相应的电商产品,而侧面信息最为突出的便是电商产品的在线评论,他们可以通过其他消费者的评论信息客观地得到产品的各维度信息。作为平台使用的商家,他们可以根据客户反馈的评论信息改进产品或制定销售策略。因此,对于电商平台的产品评论的信息处理是一个很热门的研究领域。电商平台的产品评论信息具有数量庞大和数据格式标准不一的特点,传统处理的方法有人工审阅方法,这种方法需要耗费大量的人力和时间,且取得的效果不佳。也有使用依存句法关系的定制性规则的方法,这种方法没有考虑到文本语义信息和词序的词性特征信息。此时就需要通过结合一些深度学习的算法来帮助人类处理这些庞本文档来自技高网...

【技术保护点】
1.一种面向电商产品的评价对象识别方法,其特征在于,包括以下步骤:/n获取第一评论语料,根据预设的词性从第一评论语料的句子中提取候选评价对象和候选评价词,将同一句子中的候选评价对象和候选评价词两两组成词对;/n采用训练后的词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;/n采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;/n根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合,所述词频为候选评价对象或候选评价词在词对集合中出现的次数;/n结合字词混合向量和第一候选评价对象集合,从第二候选评价对象集合获取准...

【技术特征摘要】
1.一种面向电商产品的评价对象识别方法,其特征在于,包括以下步骤:
获取第一评论语料,根据预设的词性从第一评论语料的句子中提取候选评价对象和候选评价词,将同一句子中的候选评价对象和候选评价词两两组成词对;
采用训练后的词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;
采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;
根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合,所述词频为候选评价对象或候选评价词在词对集合中出现的次数;
结合字词混合向量和第一候选评价对象集合,从第二候选评价对象集合获取准确评价对象,结合第一候选评价对象集合和准确评价对象获得准确评价对象集合,所述字词混合向量为词向量和字向量的组合。


2.根据权利要求1所述的一种面向电商产品的评价对象识别方法,其特征在于,还包括对词对关联度模型进行训练的步骤,具体为:
获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集;
构建词对关联度模型,采用训练数据集对词对关联度模型进行训练。


3.根据权利要求2所述的一种面向电商产品的评价对象识别方法,其特征在于,所述获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集,包括:
获取第二评论语料,对第二评论语料进行预处理,获得多个评论语句,所述预处理包括对第二评论语料中语句进行分词和词性标注;
采用人工方式标注出评论语句中的评价对象和评价词,将评价对象和评价词两两组合作为词对;
构建<原句子,词对>的句子对,对词对是否存有评价搭配关系进行标注,若存有评价搭配关系,类标为第一类型;反之,类标为第二类型;
将标注后评论语句组成训练数据集,所述标注后评论语句的格式为<原句子,评价词对,原句子分词后对应的词性序列,类别>。


4.根据权利要求3所述的一种面向电商产品的评价对象识别方法,其特征在于,所述词对关联度模型为基于BERT-CNN的词对关联度模型,所述词对关联度模型包括输入层、嵌入层、编码层和分类解码层,所述采用训练数据集对词对关联度模型进行训练,包括:
采用训练数据集对编码层的参数进行微调;
采用交叉熵函数作为目标函数对词对关联度模型进行训练,获得最终的词对关联度模型。


5.根据权利要求1所述的一种面向电商产品的评价对象识别方法,其特征在于,所述预设识别算法包括第一公式和第二公式,所述采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合,包括:
初始化候选评价对象集合和候选评价词集合为空;
从词对集合获取评价词,确定检测到评价词属于种子情感词,将评价词输入候选评价词集合;
从词对集...

【专利技术属性】
技术研发人员:王振宇简文军
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1