用于提取文本观点的方法、装置以及计算机存储介质制造方法及图纸

技术编号:36542854 阅读:39 留言:0更新日期:2023-02-01 16:46
本申请公开一种用于提取文本观点的方法、装置及计算机存储介质。该方法包括:获取文本;执行词典初始化;提取与特征情感连续表达词典中的词条匹配的特征情感连续表达作为第一类特征情感组合;响应于未成功提取与特征情感连续表达词典中的词条匹配的特征情感连续表达,提取与特征词典中的词条匹配的特征词以及与情感词典中的词条匹配的情感词,将特征词和情感词组合为第二类特征情感组合;确定与第一类特征情感组合或第二类特征情感组合对应的情感极性;以及基于第一类特征情感组合或第二类特征情感组合对应的特征和情感极性生成观点。本申请组合基于特征情感连续表达词典和基于规则的提取这两种观点提取方式,提高了文本观点提取的准确性。点提取的准确性。点提取的准确性。

【技术实现步骤摘要】
用于提取文本观点的方法、装置以及计算机存储介质


[0001]本申请涉及自然语言处理的
,尤其涉及一种用于提取文本观点的方法、装置以及计算机存储介质。

技术介绍

[0002]随着技术和基础设施的进步,依托于电商平台的购物活动越来越频繁。在购物活动后,顾客往往在电商平台上对商品进行评价,由此产生的大量评价文本对于电商平台、网店和商品生产商都具有很大的价值。电商平台、网店和商品生产商可从这些评价文本掌握商品情况,发掘用户潜在的痛点和需求,定位问题点,提升产品的质量和口碑,辅助新产品的研发等。例如,这些评价可帮助商品生产商采集用户需求和产品质量信息反馈,以改进其产品以更好地满足市场需求。这些评价也可帮助商家维护其口碑信誉,预测顾客的需求变化,控制存货,提高销售率等。另外,这些评价还可帮助平台获取用户的购物体验以及指导网站改进其服务。
[0003]每天在电商平台上产生的评价文本数量极其庞大,如何高效、准确地从大量的电商评价文本中提取有用的信息尤为重要。

技术实现思路

[0004]本申请提供一种用于提取文本观点的方法和装置以及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于提取文本观点的方法,其特征在于,包括:获取所述文本;执行词典初始化,所述词典包括特征情感连续表达词典、特征词典和情感词典;提取与所述特征情感连续表达词典中的词条匹配的特征情感连续表达作为第一类特征情感组合;响应于未成功提取与所述特征情感连续表达词典中的词条匹配的特征情感连续表达,提取与所述特征词典中的词条匹配的特征词以及与所述情感词典中的词条匹配的情感词,将所述特征词和所述情感词组合作为第二类特征情感组合;确定所述第一类特征情感组合或所述第二类特征情感组合对应的情感极性;以及基于所述第一类特征情感组合或所述第二类特征情感组合对应的特征和所述情感极性生成所述观点。2.根据权利要求1所述的方法,其特征在于,所述词典还包括商品分类指标词典,所述基于所述第一类特征情感组合或所述第二类特征情感组合对应的特征和所述情感极性生成所述观点之前,进一步包括:从所述商品分类指标词典中获取所述第一类特征情感组合或所述第二类特征情感组合所对应的商品分类指标;所述基于所述第一类特征情感组合或所述第二类情感特征组合对应的特征和所述情感极性生成所述观点的步骤包括:基于所述特征与所述商品分类指标的匹配结果和所述情感极性生成所述观点。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述特征情感组合所对应的商品分类指标为至少两组,基于所述文本,确定每一组商品分类指标的可靠性;以及从可靠性高于第一阈值的商品分类指标中选择可靠性最高的商品分类指标作为所述特征情感组合的商品分类指标。4.根据权利要求3所述的方法,其特征在于,响应于每一组商品分类指标的可靠性都低于所述第一阈值,利用机器学习模型从所述文本中提取所述特征情感组合的商品分类指标。5.根据权利要求2所述的方法,其特征在于,所述商品分类指标包括商品品类和依次级联的至少三级指标。6.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应未成功从所述商品分类指标词典中获取所述第一类特征情感组合或所述第二类特征情感组合所对应的商品分类指标,利用机器学习模型从所述文本中提取与所述特征词和情感词两者对应的商品分类指标;以及将所述商品分类指标添加到所述商品分类指标词典中。7.根据权利要求5所...

【专利技术属性】
技术研发人员:郑约慧万睿梁礼欣
申请(专利权)人:广东美云智数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1