情感分析方法、评价、情感分析模型的训练方法及装置制造方法及图纸

技术编号:27126922 阅读:14 留言:0更新日期:2021-01-25 19:48
本申请提供一种情感分析方法、评价、情感分析模型的训练方法及装置,涉及计算机语言文字处理技术领域。其中,通过获取待分析文本数据;采用评价主体提取模型,提取待分析文本数据中的评价主体,其中,评价主体提取模型通过评价样本数据训练获取;采用情感分析模型对各评价主体对应的待分析文本数据进行情感分析,获取各评价主体对应的情感分析结果,在此过程中,由于可以通过评价主体提取模型提取到待分析文本数据中的评价主体,进而后续进行情感分析时,可针对所提取的评价主体进行有针对性的分析,提高情感分析结果的准确性。提高情感分析结果的准确性。提高情感分析结果的准确性。

【技术实现步骤摘要】
情感分析方法、评价、情感分析模型的训练方法及装置


[0001]本申请涉及计算机语言文字处理
,特别涉及一种情感分析方法、评价、情感分析模型的训练方法及装置。

技术介绍

[0002]由于网络上的社交媒体,例如产品评论,论坛讨论,微博,微信的快速发展,情感分析方法作为挖掘人们观点,情绪,评估对诸如产品、服务、组织等实体的态度发挥越来越重要的作用。比如,通过进行情感分析,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。
[0003]现有的进行情感分析方式,一般采用句子级别的情感分析,其可以将文本数据作为模型的输入,根据已训练好的下游网络返回相关的情感倾向。
[0004]但由于现有的情感分析方法比较简单,当面对较长、较复杂的语句时,会存在分析结果不准确的问题。

技术实现思路

[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种情感分析方法、评价、情感分析模型的训练方法及装置,可以提高情感分析结果的准确性。
[0006]为实现上述目的,本申请实施例采用的技术方案如下:
[0007]第一方面,本申请实施例提供了一种情感分析方法,包括:
[0008]获取待分析文本数据;
[0009]采用评价主体提取模型,提取所述待分析文本数据中的至少一个评价主体,其中,所述评价主体提取模型通过评价样本数据训练获取;
[0010]采用情感分析模型对各所述评价主体对应的待分析文本数据进行情感分析,获取各所述评价主体对应的情感分析结果。
[0011]可选地,上述采用评价主体提取模型,提取所述待分析文本数据中的至少一个评价主体之后,还包括:
[0012]若针对所述待分析文本数据未提取到所述评价主体,则采用整句分析模型对所述待分析文本数据进行情感分析,获取所述待分析文本数据的情感分析结果。
[0013]可选地,上述采用情感分析模型对各所述评价主体对应的待分析文本数据进行情感分析,获取各所述评价主体对应的情感分析结果,包括:
[0014]采用情感分析模型对所述待分析文本数据进行情感提取,获取各所述评价主体对应的评价维度;
[0015]根据各所述评价主体对应的所述评价维度,获取所述评价维度对应的情感评价倾向;
[0016]根据所述评价主体对应的所述评价维度以及所述评价维度对应的所述情感评价倾向,获取所述评价主体对应的情感分析结果。
[0017]可选地,上述获取待分析文本数据,包括:
[0018]采集原始文本数据;
[0019]对所述原始文本数据进行预处理,获取预处理后的所述待分析文本数据。
[0020]可选地,上述对所述原始文本数据进行预处理,获取预处理后的所述待分析文本数据,包括:
[0021]对所述原始文本数据进行去噪,获取去噪后的文本数据;
[0022]根据所述去噪后的文本数据,获取预处理后的所述待分析文本数据。
[0023]可选地,上述根据所述去噪后的文本数据,获取预处理后的所述待分析文本数据,包括:
[0024]根据所述去噪后的文本数据以及所述原始文本数据所属原贴,检测获取所述去噪后的文本数据与所述原贴之间的关系;
[0025]根据所述去噪后的文本数据与所述原贴之间的关系,对所述去噪后的文本数据进行补全,获取预处理后的所述待分析文本数据。
[0026]第二方面,本申请实施例提供了一种评价模型的训练方法,包括:
[0027]获取第一训练数据集,所述第一训练数据集包括多个第一样本文本数据,所述第一样本文本数据标注有至少一个样本评价主体;
[0028]根据所述第一训练数据集,训练获取所述评价主体提取模型,所述评价主体提取模型用于获取文本数据中的至少一个评价主体。
[0029]可选地,上述根据所述第一训练数据集,训练获取所述评价主体提取模型,包括:
[0030]通过预训练模型获取各所述第一样本文本数据的句向量;
[0031]根据各所述第一样本文本数据的句向量和条件随机场模型,训练获取所述评价主体提取模型。
[0032]第三方面,本申请实施例提供了一种情感分析模型的训练方法,所述方法还包括:
[0033]获取第二训练数据集,所述第二训练数据集包括多个第二样本文本数据,所述第二样本文本数据标注有至少一个评价主体、各所述评价主体对应的评价维度、所述评价维度对应的情感评价倾向以及各所述评价主体对应的情感分析结果;
[0034]根据所述第二训练数据集,训练获取所述情感分析模型,所述情感分析模型用于获取文本数据中评价主体对应的情感分析结果。
[0035]第四方面,本申请实施例提供了一种情感分析装置,包括:获取模块、提取模块以及分析模块;
[0036]所述获取模块,用于获取待分析文本数据;
[0037]所述提取模块,用于采用评价主体提取模型,提取所述待分析文本数据中的至少一个评价主体,其中,所述评价主体提取模型通过评价样本数据训练获取;
[0038]所述分析模块,用于采用情感分析模型对各所述评价主体对应的待分析文本数据进行情感分析,获取各所述评价主体对应的情感分析结果。
[0039]可选地,所述提取模块,还用于若针对所述待分析文本数据未提取到所述评价主体,则采用整句分析模型对所述待分析文本数据进行情感分析,获取所述待分析文本数据的情感分析结果。
[0040]可选地,所述获取模块,具体用于采用情感分析模型对所述待分析文本数据进行
情感提取,获取各所述评价主体对应的评价维度;
[0041]根据各所述评价主体对应的所述评价维度,获取所述评价维度对应的情感评价倾向;
[0042]根据所述评价主体对应的所述评价维度以及所述评价维度对应的所述情感评价倾向,获取所述评价主体对应的情感分析结果。
[0043]可选地,所述获取模块,具体用于采集原始文本数据;
[0044]对所述原始文本数据进行预处理,获取预处理后的所述待分析文本数据。
[0045]可选地,所述获取模块,具体用于对所述原始文本数据进行去噪,获取去噪后的文本数据;
[0046]根据所述去噪后的文本数据,获取预处理后的所述待分析文本数据。
[0047]可选地,所述获取模块,具体用于根据所述去噪后的文本数据以及所述原始文本数据所属原贴,检测获取所述去噪后的文本数据与所述原贴之间的关系;
[0048]根据所述去噪后的文本数据与所述原贴之间的关系,对所述去噪后的文本数据进行补全,获取预处理后的所述待分析文本数据。
[0049]第五方面,本申请实施例提供了一种评价模型的训练装置,所述装置包括:第一获取模块和第一训练模块;
[0050]所述第一获取模块,用于获取第一训练数据集,所述第一训练数据集包括多个第一样本文本数据,所述第一样本文本数据标注有至少一个样本评价主体;
[0051]所述第一训练模块,用于根据所述第一训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感分析方法,其特征在于,包括:获取待分析文本数据;采用评价主体提取模型,提取所述待分析文本数据中的至少一个评价主体,其中,所述评价主体提取模型通过评价样本数据训练获取;采用情感分析模型对各所述评价主体对应的待分析文本数据进行情感分析,获取各所述评价主体对应的情感分析结果。2.根据权利要求1所述的情感分析方法,其特征在于,所述采用评价主体提取模型,提取所述待分析文本数据中的至少一个评价主体之后,还包括:若针对所述待分析文本数据未提取到所述评价主体,则采用整句分析模型对所述待分析文本数据进行情感分析,获取所述待分析文本数据的情感分析结果。3.根据权利要求1所述的情感分析方法,其特征在于,所述采用情感分析模型对各所述评价主体对应的待分析文本数据进行情感分析,获取各所述评价主体对应的情感分析结果,包括:采用情感分析模型对所述待分析文本数据进行情感提取,获取各所述评价主体对应的评价维度;根据各所述评价主体对应的所述评价维度,获取所述评价维度对应的情感评价倾向;根据所述评价主体对应的所述评价维度以及所述评价维度对应的所述情感评价倾向,获取所述评价主体对应的情感分析结果。4.根据权利要求1所述的情感分析方法,其特征在于,所述获取待分析文本数据,包括:采集原始文本数据;对所述原始文本数据进行预处理,获取预处理后的所述待分析文本数据。5.根据权利要求4所述的情感分析方法,其特征在于,所述对所述原始文本数据进行预处理,获取预处理后的所述待分析文本数据,包括:对所述原始文本数据进行去噪,获取去噪后的文本数据;根据所述去噪后的文本数据,获取预处理后的所述待分析文本数据。6.根据权利要求5所述的情感分析方法,其特征在于,所述根据所述去噪后的文本数据,获取预处理后的所述待分析文本数据,包括:根据所述去噪后的文本数据以及所述原始文本数据所属原贴,检测获取所述去噪后的文本数据与所述原贴之间的关系;根据所述去噪后的文本数据与所述原贴之间的关系,对所述去噪后的文本数据进行补全,获取预处理后的所述待分析文本数据。7.一种评价模型的训练方法,其特征在于,所述方法包括:获取第一训练数据集,所述第一训练数据集包括多个第一样本文本数据,所述第一样本文本数据标注有至少一个样本评价主体;根据所述第一训练数据集,训练获取所述评价主体提取模型,所述评价主体提取模型用于获取文本数据中的至少一个评价主体。8.根据权利要求7所述的训练方法,其特征在于,所述根据所述第一训练数据集,训练获取所述评价主体提取模型,包括:通过预训练模型获取各所述第一样本文本数据的句向量;
根据各所述第一样本文本数据的句向...

【专利技术属性】
技术研发人员:汪硕芃常永炷郝雷光张聪范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1