一种针对餐饮行业评论的细粒度情感分析方法及装置制造方法及图纸

技术编号:34725412 阅读:48 留言:0更新日期:2022-08-31 18:12
本发明专利技术实施例提供了一种针对餐饮行业评论的细粒度情感分析方法及装置,通过获取餐饮评论文本,并确定所述餐饮评论文本中包含的主题词语所对应的主题标签;其中,所述餐饮评论文本包括至少一个主题词语,所述主题词语和主题标签一一对应;所述主题标签包括服务、价格、位置、环境、味道以及其他;依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集;依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集;依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果。通过将文本向量化,并采用不平衡学习理论下的重采样技术数据中的类不平衡问题,进而防止模型产生偏向性识别。而防止模型产生偏向性识别。而防止模型产生偏向性识别。

【技术实现步骤摘要】
一种针对餐饮行业评论的细粒度情感分析方法及装置


[0001]本专利技术涉及信息处理领域,具体涉及一种针对餐饮行业评论的细粒度情感分析方法及装置。

技术介绍

[0002]随着大数据和餐饮信息化的快速发展,餐饮智能的地位日益突出。网络文本作为现代消费者承载感知和表达观点的载体,日益成为餐饮智能分析的重要数据来源,也是现代餐饮智能的重要支撑。许多研究工作表明,如何对急速增长的外部信息进行搜索并吸收变得越来越重要,其中一个重要方面就是如何更好地获取大量用户的偏好。在线评论信息所蕴含的消费者情感倾向对于商家持续优化经营策略、提升服务和商品品质具有重要意义。自然语言处理技术作为文本分析的有效手段,其性能表现已经得到学界广泛认可。另外,深度学习技术的进一步发展,为自然语言提供了强大的学习机制,极大地推动了自然语言处理技术的快速发展。文本情感分析问题可以看成是文本属性的识别问题,即文本分类问题。由于一条评论所涉及的主题并不是单一的,故而餐饮评论的细粒度情感分析是一个文本多标签分类问题,即文本序列到属性集合的映射关系。
[0003]近年来针对文本情感分析方法的研究层出不穷,利用情感词典法来对句子进行情感倾向分类。
[0004]但现有技术中,大多不能对情感进行细分并没有处理观点句中的否定现象,然而对这些评论文本情感的机器识别是困难的,并且表现出三个明显的挑战,即文本语义的复杂性,现实文本数据的多标签性和类别不平衡问题。

技术实现思路

[0005]鉴于所述问题,提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的一种针对餐饮行业评论的细粒度情感分析方法及装置,包括:
[0006]一种针对餐饮行业评论的细粒度情感分析方法,包括:
[0007]获取餐饮评论文本,并确定所述餐饮评论文本中包含的主题词语所对应的主题标签;其中,所述餐饮评论文本包括至少一个主题词语,所述主题词语和主题标签一一对应;所述主题标签包括服务、价格、位置、环境、味道以及其他;
[0008]依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集;
[0009]依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集;
[0010]依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果;其中,所述餐饮评论的细粒度情感分析结果包括六维属性和二元情感极性。
[0011]优选地,所述依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集的步骤,包括:
[0012]依据所述餐饮评论文本的主题标签中主题标签的数量在预设范围内的餐饮评论文本的主题标签生成合成标签;
[0013]依据所述合成标签和所述餐饮评论文本的主题标签生成所述不平衡数据集。
[0014]优选地,所述依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集的步骤,包括:
[0015]依据所述不平衡数据集中的每个词语进行映射生成对应于所述餐饮评论文本的向量数据集;
[0016]对所述对应于所述餐饮评论文本的向量数据集进行特征提取生成对应于所述餐饮评论文本的文本特征集。
[0017]优选地,所述依据所述不平衡数据集中的每个词语进行映射生成对应于所述餐饮评论文本的向量数据集的步骤,包括:
[0018]将所述向量数据集中的每个词语映射为向量点,并依据所述向量数据集中的每个词语相对应的向量点生成对应于所述餐饮评论文本的向量数据集。
[0019]优选地,所述对所述对应于所述餐饮评论文本的向量数据集进行特征提取生成对应于所述餐饮评论文本的文本特征集的步骤,包括:
[0020]依据所述对应于所述餐饮评论文本的向量数据集中餐饮评论文本的动态表征生成对应的768维的特征向量集;
[0021]依据所述768维的特征向量集集中每个词语的词向量生成对应的卷积数据集;
[0022]对所述卷积数据集进行特征降维生成所述对应于所述餐饮评论文本的文本特征集。
[0023]优选地,所述依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果的步骤,包括:
[0024]依据所述对应于所述餐饮评论文本的文本特征集进行属性回归生成对应于所述餐饮评论文本的六维属性;
[0025]依据所述对应于所述餐饮评论文本的文本特征集进行情感回归生成对应于所述餐饮评论文本的二元情感极性。
[0026]优选地,所述确定所述餐饮评论文本中包含的主题词语所对应的主题标签的步骤,包括:
[0027]依据所述餐饮评论文本生成所对应的分词文本数据集;
[0028]依据所述分词文本数据集生成所对应的去停用词数据集;
[0029]依据所述去停用词数据集生成所对应的所述餐饮评论主题集。
[0030]为实现本申请还包括一种针对餐饮行业评论的细粒度情感分析装置,包括:
[0031]主题标签模块,用于获取餐饮评论文本,并确定所述餐饮评论文本中包含的主题词语所对应的主题标签;其中,所述餐饮评论文本包括至少一个主题词语,所述主题词语和主题标签一一对应;所述主题标签包括服务、价格、位置、环境、味道以及其他;
[0032]不平衡数据集模块,用于依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集;
[0033]文本特征集模块,用于依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集;
[0034]细粒度情感分析结果模块,用于依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果;其中,所述餐饮评论的细粒度情感分析结果包括六维属性和二
元情感极性。
[0035]为实现本申请还包括一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如所述的针对餐饮行业评论的细粒度情感分析方法的步骤。
[0036]为实现本申请还包括一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如所述的针对餐饮行业评论的细粒度情感分析方法的步骤。
[0037]本申请具有以下优点:
[0038]在本申请的实施例中,通过获取餐饮评论文本,并确定所述餐饮评论文本中包含的主题词语所对应的主题标签;其中,所述餐饮评论文本包括至少一个主题词语,所述主题词语和主题标签一一对应;所述主题标签包括服务、价格、位置、环境、味道以及其他;依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集;依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集;依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果;其中,所述餐饮评论的细粒度情感分析结果包括六维属性和二元情感极性。通过将文本向量化,并采用不平衡学习理论下的重采样技术SMOTE算法处理数据中的类不平衡问题,进而防止模型产生偏向性识别。本申请所提出的文本情感分析方法,处理了数据中的类不平衡问题,提升了模型的预测精度,同时改进经典的TextCNN神本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对餐饮行业评论的细粒度情感分析方法,其特征在于,包括:获取餐饮评论文本,并确定所述餐饮评论文本中包含的主题词语所对应的主题标签;其中,所述餐饮评论文本包括至少一个主题词语,所述主题词语和主题标签一一对应;所述主题标签包括服务、价格、位置、环境、味道以及其他;依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集;依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集;依据所述文本特征集生成对应于所述餐饮评论文本的细粒度情感分析结果;其中,所述餐饮评论的细粒度情感分析结果包括六维属性和二元情感极性。2.根据权利要求1所述的针对餐饮行业评论的细粒度情感分析方法,其特征在于,所述依据所述餐饮评论文本的主题标签中主题标签的数量生成不平衡数据集的步骤,包括:依据所述餐饮评论文本的主题标签中主题标签的数量在预设范围内的餐饮评论文本的主题标签生成合成标签;依据所述合成标签和所述餐饮评论文本的主题标签生成所述不平衡数据集。3.根据权利要求1所述的针对餐饮行业评论的细粒度情感分析方法,其特征在于,所述依据所述不平衡数据集生成对应于所述餐饮评论文本的文本特征集的步骤,包括:依据所述不平衡数据集中的每个词语进行映射生成对应于所述餐饮评论文本的向量数据集;对所述对应于所述餐饮评论文本的向量数据集进行特征提取生成对应于所述餐饮评论文本的文本特征集。4.根据权利要求3所述的针对餐饮行业评论的细粒度情感分析方法,其特征在于,所述依据所述不平衡数据集中的每个词语进行映射生成对应于所述餐饮评论文本的向量数据集的步骤,包括:将所述向量数据集中的每个词语映射为向量点,并依据所述向量数据集中的每个词语相对应的向量点生成对应于所述餐饮评论文本的向量数据集。5.根据权利要求3所述的针对餐饮行业评论的细粒度情感分析方法,其特征在于,所述对所述对应于所述餐饮评论文本的向量数据集进行特征提取生成对应于所述餐饮评论文本的文本特征集的步骤,包括:依据所述对应于所述餐饮评论文本的向量数据集中餐饮评论文本的动态表征生成对应的768维的特征向量集;依据所述768维的特征向量集集中每个词语的...

【专利技术属性】
技术研发人员:张文欧阳彬廖岳陵董倩姜永滚
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1