产品反馈信息的关键词提取方法及终端设备技术

技术编号:32466967 阅读:19 留言:0更新日期:2022-03-02 09:25
本申请属于数据处理的技术领域,提供了一种产品反馈信息的关键词提取方法及终端设备,该方法包括:获取产品反馈信息,根据所有所述产品反馈信息生成反馈信息图谱;确定产品反馈信息中的各个语句对应的情感维度因子;基于与所述一级关键词相关的所述语句的数量和与所述一级关键词相关的所述情感维度因子,得到所述一级关键词的一级特征数值;根据所述一级特征数值对所有所述一级关键词排序。本申请实施例解决产品分析报告可信度低以及运算效率低下的问题。下的问题。下的问题。

【技术实现步骤摘要】
产品反馈信息的关键词提取方法及终端设备


[0001]本专利技术涉及数据处理的
,尤其涉及一种产品反馈信息的关键词提取方法及终端设备。

技术介绍

[0002]在移动互联网跨越式发展的大趋势下,对大数据进行计算分析获得目标信息已经成为重要方法。随着各大厂家售后服务的愈加完善,产品在销售后会收到大量用户使用过程中的问题反馈,从而得到海量的产品问题反馈信息。
[0003]在现有计算分析方法中,为从海量问题反馈信息中提取目标信息生成关键词,例如关于用户关注的产品问题(痛点)的关键词,需对问题反馈信息进行计算。具体的,通常通过繁琐的统计海量反馈信息中各个产品问题的反馈数量来确定用户关注的产品问题,然后将用户关注的产品问题确定为关键词,对确定的关键词按关注度进行排序。但现有方法仅考虑了反馈信息中用户的关注度而忽略了其它有效信息,导致从反馈信息中提取到的关键词较为笼统,造成根据反馈信息提取到的关键词可信度低;且对海量的反馈信息进行繁琐复杂的统计计算导致关键词提取过程中需进行大量运算,效率低下。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种产品反馈信息的关键词提取方法及终端设备,以解决产品分析报告可信度低以及运算效率低下的问题。
[0005]本专利技术实施例的第一方面提供了一种产品反馈信息的关键词提取方法,包括:
[0006]获取产品反馈信息,根据所述产品反馈信息生成反馈信息图谱;所述产品反馈信息包括用于描述目标产品问题信息的语句;所述反馈信息图谱包括N个一级关键词,所述N为大于1的整数;
[0007]确定所述产品反馈信息中的各个所述语句对应的情感维度因子;
[0008]基于与所述一级关键词相关的所述语句的数量和与所述一级关键词相关的所述情感维度因子,得到所述一级关键词的一级特征数值;
[0009]根据所述一级特征数值对所有所述一级关键词排序。
[0010]在一个实施示例中,每一所述一级关键词关联有若干个二级关键词;
[0011]根据所述一级特征数值对所有所述一级关键词排序,包括:
[0012]基于与所述二级关键词相关的所述语句的数量和与所述二级关键词相关的所述情感维度因子,得到所述二级关键词的二级特征数值;
[0013]根据所述一级特征数值以及所述一级关键词关联的所述二级关键词的所述二级特征数值,对所有所述一级关键词和所述二级关键词排序。
[0014]在一个实施示例中,所述获取产品反馈信息,根据所有所述产品反馈信息生成反馈信息图谱,包括:
[0015]根据所述产品反馈信息中的每一所述语句包含的预设词性的词语,生成待筛选特
征合集;
[0016]确定所述预设词性的词语中的无效词语;
[0017]将所述无效词语从所述待筛选特征集合中筛除,得到产品问题特征合集;
[0018]对所述产品问题特征合集进行语义聚类,生成所述反馈信息图谱。
[0019]在一个实施示例中,所述确定所述预设词性的词语中的无效词语,包括:
[0020]统计各个所述预设词性的词语在所有所述语句内的出现次数,将所述出现次数小于预设次数阈值或在记录于通用词典内的所述预设词性的词语识别为无效词语。
[0021]在一个实施示例中,所述确定所述产品反馈信息中的各个所述语句对应的情感维度因子,包括:
[0022]分别从各个所述语句中提取预设的情感词典中包含的情感特征词,并基于所述语句内包含的所述情感特征词,生成所述语句对应的情感短语;
[0023]获取各个所述情感短语的短语情感值,并将所述短语情感值为负值的所述情感短语识别为目标短语;
[0024]基于所述语句包含的所有所述目标短语的所述短语情感值,得到所述语句对应的所述情感维度因子。
[0025]在一个实施示例中,所述获取各个所述情感短语的短语情感值,并将所述短语情感值为负值的所述情感短语识别为目标短语,包括:
[0026]若所述情感短语不包含副词,则从所述情感词典中获取所述情感特征词的情感值,确定所述情感值为所述短语情感值;
[0027]若所述情感短语包含副词,则确定所述副词的词语属性,从所述情感词典中获取所述情感特征词的情感值,将所述情感值与所述词语属性对应的预设情感值相乘得到所述短语情感值;所述词语属性包括增强型程度副词、减弱型程度副词和/或否定词。
[0028]在一个实施示例中,所述基于与所述一级关键词相关的所述语句的数量和与所述一级关键词相关的所述情感维度因子,得到所述一级关键词的一级特征数值,包括:
[0029]根据各个所述一级关键词相关的所述语句的所述情感维度因子得到各个所述一级关键词对应的第一情感极性值;
[0030]对于每一所述一级关键词,对所述一级关键词相关的所述语句的数量和所述一级关键词对应的所述第一情感极性值进行加权平均计算得到所述一级关键词的所述一级特征数值。
[0031]在一个实施示例中,所述基于与所述二级关键词相关的所述语句的数量和与所述二级关键词相关的所述情感维度因子,得到所述二级关键词的二级特征数值,包括:
[0032]根据各个所述二级关键词相关的所述语句的所述情感维度因子得到各个所述二级关键词对应的第二情感极性值;
[0033]对于每一所述二级关键词,对所述二级关键词相关的所述语句的数量和所述二级关键词对应的所述第二情感极性值进行加权平均计算得到所述二级关键词的所述二级特征数值。
[0034]在一个实施示例中,所述根据各个所述二级关键词相关的所述语句的所述情感维度因子得到各个所述二级关键词对应的第二情感极性值,包括:
[0035]对于每一所述二级关键词,计算所述二级关键词相关的所述语句对应的所述情感
维度因子均值得到所述二级关键词对应的第二情感极性值。
[0036]本专利技术实施例的第二方面提供了一种产品反馈信息的关键词提取装置,包括:
[0037]反馈信息图谱生成模块,用于获取产品反馈信息,根据所有所述产品反馈信息生成反馈信息图谱;所述产品反馈信息包括用于描述目标产品问题信息的语句;所述反馈信息图谱包括N个一级关键词,所述N为大于1的整数;
[0038]情感维度因子确定模块,用于确定所述产品反馈信息中的各个所述语句对应的情感维度因子;
[0039]一级特征数值计算模块,用于基于与所述一级关键词相关的所述语句的数量和与所述一级关键词相关的所述情感维度因子,得到所述一级关键词的一级特征数值;
[0040]关键词排序模块,用于根据所述一级特征数值对所有所述一级关键词排序。
[0041]本专利技术实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
[0042]本专利技术实施例的第四方面提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产品反馈信息的关键词提取方法,其特征在于,包括:获取产品反馈信息,根据所述产品反馈信息生成反馈信息图谱;所述产品反馈信息包括用于描述目标产品问题信息的语句;所述反馈信息图谱包括N个一级关键词,所述N为大于1的整数;确定所述产品反馈信息中的各个所述语句对应的情感维度因子;基于与所述一级关键词相关的所述语句的数量和与所述一级关键词相关的所述情感维度因子,得到所述一级关键词的一级特征数值;根据所述一级特征数值对所有所述一级关键词排序。2.如权利要求1所述的产品反馈信息的关键词提取方法,其特征在于,每一所述一级关键词关联有若干个二级关键词;根据所述一级特征数值对所有所述一级关键词排序,包括:基于与所述二级关键词相关的所述语句的数量和与所述二级关键词相关的所述情感维度因子,得到所述二级关键词的二级特征数值;根据所述一级特征数值以及所述一级关键词关联的所述二级关键词的所述二级特征数值,对所有所述一级关键词和所述二级关键词排序。3.如权利要求1所述的产品反馈信息的关键词提取方法,其特征在于,所述获取产品反馈信息,根据所有所述产品反馈信息生成反馈信息图谱,包括:根据所述产品反馈信息中的每一所述语句包含的预设词性的词语,生成待筛选特征合集;确定所述预设词性的词语中的无效词语;将所述无效词语从所述待筛选特征集合中筛除,得到产品问题特征合集;对所述产品问题特征合集进行语义聚类,生成所述反馈信息图谱。4.如权利要求3所述的产品反馈信息的关键词提取方法,其特征在于,所述确定所述预设词性的词语中的无效词语,包括:统计各个所述预设词性的词语在所有所述语句内的出现次数,将所述出现次数小于预设次数阈值或在记录于通用词典内的所述预设词性的词语识别为无效词语。5.如权利要求1所述的产品反馈信息的关键词提取方法,其特征在于,所述确定所述产品反馈信息中的各个所述语句对应的情感维度因子,包括:分别从各个所述语句中提取预设的情感词典中包含的情感特征词,并基于所述语句内包含的所述情感特征词,生成所述语句对应的情感短语;获取各个所述情感短语的短语情感值,并将所述短语情感值为负值的所述情感短语识别为目标短语;基于所述语句包含的所有所述目标短语的所述短语情感值,得到所述语句对应的所述情感维度因子。6.如...

【专利技术属性】
技术研发人员:李超张高升刘孝
申请(专利权)人:武汉TCL集团工业研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1