一种情感识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26259801 阅读:12 留言:0更新日期:2020-11-06 17:54
本发明专利技术公开了一种情感识别方法、装置、计算机设备及存储介质,该方法包括:对待识别文本进行分词处理,获取分词结果;遍历分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在分词,若存在,则直接获取分词对应的原始分值,否则,从目标情感词典中获取与分词对应的相似词,根据相似词的原始分值确定分词的原始分值;根据每个分词对应的原始分值以及每个分词的属性计算得到待识别文本的情感分值;根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。本发明专利技术当待识别的文本包含情感词典中不存在的词时,在情感词典的基础上,基于词向量给出相似词,计算获取对应的情感值,保证了识别效果。

【技术实现步骤摘要】
一种情感识别方法、装置、计算机设备及存储介质
本专利技术涉及数据处理
,特别涉及一种情感识别方法、装置、计算机设备及存储介质。
技术介绍
语音对话系统是自然度较高的人机交互系统之一。随着智能客服、智能音响、智能家电的加速普及,机器与人的对话已经是人工智能技术重要的落地方式之一。而随着目前智能客服和催收机器人等工具的使用,有效的分担了人工客服的工作量,节省了企业用人成本。但是和人工客服相比,现阶段的客服机器人只能解决常规的、重复性的一系列简单问题,暂时还不能为用户提供针对性服务。并且,由于人与人的沟通并不仅仅是语言信息的交流,更体现出对话双方说话习惯、情绪等多方面的表达,若对话双方在一段对话中表达方式甚至是情感上达到共鸣,可以快速拉进对话双方的关系,然而客服机器人的回复通常比较机械不带有感情色彩。目前现有技术中,通常基于一些情感词典对文本等信息进行情感识别,但是,一方面,在如今的网络信息时代,新词的出现如雨后春笋,另一方面,我们整理的情感词典中,也不可能完全包含已有的情感词语,这将大大影响识别效果。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种情感识别方法、装置、计算机设备以及存储介质,以克服现有技术中基于情感词典对文本等信息进行情感识别时,由于情感词典不能完全包含已有的情感词语导致识别较高差等问题。为解决上述一个或多个技术问题,本专利技术采用的技术方案是:第一方面,提供了一种情感识别方法,该方法包括如下步骤:对待识别文本进行分词处理,获取分词结果;遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。进一步的,所述从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值包括:分别计算所述分词与所述目标情感词典中词语的相似度,获取相似度满足预设条件的词语作为所述分词的相似词;根据所述相似词的原始分值以及预设的计算规则计算得到所述分词的原始分值。进一步的,所述方法还包括所述目标情感词典的更新过程,包括:将所述目标情感词典中不存在的所述分词以及所述分词对应的原始分值添加至所述目标情感词典的与所述情感类别对应的子词典中。进一步的,在对待识别文本进行分词处理前,所述方法还包括:对所述待识别文本进行预处理,去除所述待识别文本中的非必要信息,所述非必要信息至少包括特殊符号。进一步的,所述方法还包括待识别文本的获取过程,包括:对接收到的待识别语音信息进行语音识别,将所述待识别语音信息转换为待识别文本。进一步的,所述方法还包括目标情感词典的构建过程,包括:将预先选取的多个情感词典进行合并去重处理,获取基础情感词典;利用预先准备的训练语料对所述基础情感词典进行训练,获取目标情感词典。第二方面,提供了一种情感识别装置,所述装置包括:分词处理模块,用于对待识别文本进行分词处理,获取分词结果;分值确定模块,用于遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;分值计算模块,用于根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;类别确定模块,用于根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。进一步的,所述分值确定模块具体用于:分别计算所述分词与所述目标情感词典中词语的相似度,获取相似度满足预设条件的词语作为所述分词的相似词;根据所述相似词的原始分值以及预设的计算规则计算得到所述分词的原始分值。第三方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:对待识别文本进行分词处理,获取分词结果;遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如下步骤:对待识别文本进行分词处理,获取分词结果;遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。本专利技术实施例提供的技术方案带来的有益效果是:1、本专利技术实施例提供的情感识别方法、装置、计算机设备及存储介质,通过对待识别文本进行分词处理,获取分词结果,遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值,根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值,根据所述情感分值以及预设阈值确定所述待识别文本的情感类别,当待识别的文本包含情感词典中不存在的词时,在情感词典的基础上,基于词向量给出相似词,计算获取对应的情感值,保证了识别效果;2、本专利技术实施例提供的情感识别方法、装置、计算机设备及存储介质,通过将所述目标情感词典中不存在的所述分词以及所述分词对应的原始分值添加至所述目标情感词典的与所述情感类别对应的子词典中,实现情感词词典的自动扩充,进行情感词典的优化,保证了模型的时效性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的情感识别方法的流程图;图2是根据一示例性实施例示本文档来自技高网...

【技术保护点】
1.一种情感识别方法,其特征在于,所述方法包括如下步骤:/n对待识别文本进行分词处理,获取分词结果;/n遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;/n根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;/n根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。/n

【技术特征摘要】
1.一种情感识别方法,其特征在于,所述方法包括如下步骤:
对待识别文本进行分词处理,获取分词结果;
遍历所述分词结果中每个分词,在预先构建的目标情感词典中依次查询是否存在所述分词,若存在,则直接获取所述分词对应的原始分值,否则,从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值;
根据每个所述分词对应的原始分值以及每个所述分词的属性计算得到所述待识别文本的情感分值;
根据所述情感分值以及预设阈值确定所述待识别文本的情感类别。


2.根据权利要求1所述的情感识别方法,其特征在于,所述从所述目标情感词典中获取与所述分词对应的相似词,根据所述相似词的原始分值确定所述分词的原始分值包括:
分别计算所述分词与所述目标情感词典中词语的相似度,获取相似度满足预设条件的词语作为所述分词的相似词;
根据所述相似词的原始分值以及预设的计算规则计算得到所述分词的原始分值。


3.根据权利要求1或2所述的情感识别方法,其特征在于,所述方法还包括所述目标情感词典的更新过程,包括:
将所述目标情感词典中不存在的所述分词以及所述分词对应的原始分值添加至所述目标情感词典的与所述情感类别对应的子词典中。


4.根据权利要求1或2所述的情感识别方法,其特征在于,在对待识别文本进行分词处理前,所述方法还包括:
对所述待识别文本进行预处理,去除所述待识别文本中的非必要信息,所述非必要信息至少包括特殊符号。


5.根据权利要求1或2所述的情感识别方法,其特征在于,所述方法还包括待识别文本的获取过程,包括:
对接收到的待识别语音信息进行语音识别,将所述待识别...

【专利技术属性】
技术研发人员:刘鹏程陈超王岗杜柏圣
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1