【技术实现步骤摘要】
情感原因子句标签的抽取方法、装置、设备及存储介质
本专利技术涉及计算机深度学习
,尤其涉及一种情感原因子句标签的抽取方法、装置、设备及存储介质。
技术介绍
随着计算机深度学习技术的发展,情感原因抽取越来越成为业内的研究重点,如某公司在收集到用户对公司产品和服务所给出的评价的感情倾向后,分析产生该评价的情感原因,可以帮助该公司更好的改进产品、改善用户体验,以及进一步地对用户进行个性化推荐。又如,通过收集公众对某热点事件的评价,分析产生该评价的情感原因,可为预防和平息公众负面情绪提供有力的决策依据。相应地,也对情感原因抽取提出了越来越高的要求,而现有技术在进行情感原因抽取时,未充分考虑文档中情感原因子句的特征信息,且情感原因抽取的工作量过大,抽取过程繁琐,导致抽取的情感原因子句的准确度和效率堪忧,因此,如何提高情感原因抽取的准确度和效率,成为一个亟待解决的问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供了一种情感原因子 ...
【技术保护点】
1.一种情感原因子句标签的抽取方法,其特征在于,所述方法包括以下步骤:/n获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集;/n将所述情感原因词汇集和所述情感描述词汇集输入至预设双向长短期记忆网络中进行编码处理,以获得情感原因特征和情感描述特征;/n将所述情感原因特征和所述情感描述特征输入至预设自注意力模型,以获得情感原因自注意力信息和情感描述自注意力信息;/n获取所述候选情感原因子句的相邻子句对应的目标相邻特征;/n对所述情感原因自注意力信息、所述情感描述自注意力信息以及所述目标 ...
【技术特征摘要】
1.一种情感原因子句标签的抽取方法,其特征在于,所述方法包括以下步骤:
获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集;
将所述情感原因词汇集和所述情感描述词汇集输入至预设双向长短期记忆网络中进行编码处理,以获得情感原因特征和情感描述特征;
将所述情感原因特征和所述情感描述特征输入至预设自注意力模型,以获得情感原因自注意力信息和情感描述自注意力信息;
获取所述候选情感原因子句的相邻子句对应的目标相邻特征;
对所述情感原因自注意力信息、所述情感描述自注意力信息以及所述目标相邻特征进行连接,获得特征连接信息,并对所述特征连接信息进行分类处理,获得情感原因子句标签。
2.如权利要求1所述的方法,其特征在于,所述获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集的步骤之前,还包括:
从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,并获取所述相对位置对应的位置特征;
相应地,所述获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集的步骤,具体包括:
基于所述位置特征获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集。
3.如权利要求2所述的方法,其特征在于,所述从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,并获取所述相对位置对应的位置特征的步骤,具体包括:
从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,通过位置嵌入矩阵将所述相对位置转换为位置向量;
将所述位置向量通过线性整流函数进行非线性变换,获得非线性数据;
对所述非线性数据进行线性变换,获得对应的位置特征。
4.如权利要求2所述的方法,其特征在于,所述将所述情感原因词汇集和所述情感描述词汇集输入至预设双向长短期记忆网络中进行编码处理,以获得情感原因特征和情感描述特征的步骤,具体包括:
通过Word2vec模型将所述情感原因词汇集映射为情感原因向量;
将所述情感原因向量输入至预设双向长短期记忆网络中进行编码处理,以获得正向情感原因向量和反向情感原因向量;
基于所述正向情感原因向量、所述反向情感原因向量以及所述位置特征生成情感原因特征;
通过所述Word2vec模型将所述情感描述词汇集映射为情感描述向量;
将所述情感描述向量输入至所述预设双向长短期记忆网络中进行编码处理,以获得正向情感描述向量和反向情感描述向量;
基于所述正向情感描述向量和所述反向情感描述向量生成情感描述特征。
5.如权利要求1所述的方法,其特征在于,所述将所述情感原因特征和所述情感描述特征输入至预设自注意力模型,以获得情感原因自注意力信息和情感描述自注意力信息的步骤,具体包括:
将所述情感原因特征输入至预设自注意力模型中分别与查询矩阵、键值矩阵以及值矩阵相乘,获得对应的情感原因查询向量、情感原因键值向量以及情感原因值向量,并将所述情感描述特征输入至所述预设自注意力模型...
【专利技术属性】
技术研发人员:刘晶,孟凯,覃俊,李子茂,宋中山,夏梦,廖立婷,
申请(专利权)人:中南民族大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。