对话情感分析方法和系统技术方案

技术编号:20484957 阅读:29 留言:0更新日期:2019-03-02 19:00
本发明专利技术公开了一种对话情感分析系统和方法。本发明专利技术对话情感分析系统和方法,能够通过深度挖掘聊天记录中的主题和实体情感,实现对聊天双方相互间情感的分析和判别。该系统包括主题切割模块、主题情感识别模块和情感序列分析模块,该主题切割模块通过主题分类和命名实体识别技术将聊天语料切割成多个主题语料集;该主题情感识别模块通过情感分类算法分析聊天用户对当前主题的角色主题情感;该情感序列挖掘算法对角色主题情感序列进行序列分析,最终数显聊天对象之间的情感判别。

【技术实现步骤摘要】
对话情感分析方法和系统
本专利技术涉及聊天情感分析领域,具体涉及一种对话情感分析方法和系统。
技术介绍
随着社会的发展和网络技术的进步,人们之间的沟通交流越来越频繁,交流方式也越来越多样,准确识别人人对话中的情感对于呼叫中心等电话服务行业具有非常重要的意义。然而人们在对话时的情感表达是十分复杂的。传统技术存在以下技术问题:现有的对话情感分析方法往往只能分析对话的情感倾向,无法分析出变化过程。
技术实现思路
本专利技术要解决的技术问题是提供一种面向用户聊天对话的情感分析系统和方法,通过主题切割模块将用户间的对话语料切割成多个主题语料集合,主题情感识别模块分析主题语料集得到各角色主题情感倾向并通过情感倾向序列挖掘模块获得角色间对话情感,实现通过对话发现用户间情感倾向以及变化过程。为了解决上述技术问题,本专利技术提供了一种对话情感分析方法,包括:主题切割算法,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;主题情感识别算法,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;情感序列挖掘算法,对主体情感识别算法给出的每个角色主题情感对进行挖掘,最终给出角色间情感结果。在其中一个实施例中,“主题切割算法,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;”具体包括:LDA主题分类算法,对每个句子进行内容主题识别,得到每个句子的最高可能主题候选;名实体识别算法,对每个句子分析得到实体候选;题融合切割算法,对LDA主题分类算法和命名实体识别算法得到的句子主题标签和实体标签进行前后序列整理,给出按照主题内容的对话句子集切割子集。在其中一个实施例中,“主题情感算法,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;”具体包括:句子情感识别算法,通过一个预先训练的文本情感分类器或者关键词模型,判别主题语料句子集的每个句子的情感;综合情感判别算法,该算法通过统计、向量分析以及序列挖掘算法,判断不同角色对当前主题的情感倾向。一种对话情感分析系统,包括:主题切割模块,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;主题情感识别模块,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;情感序列挖掘模块,对主体情感识别算法给出的每个角色主题情感对进行挖掘,最终给出角色间情感结果。在其中一个实施例中,所述主题切割模块具体包括:LDA主题分类单元,对每个句子进行内容主题识别,得到每个句子的最高可能主题候选;名实体识别单元,对每个句子分析得到实体候选;题融合切割单元,对LDA主题分类单元和命名实体识别单元得到的句子主题标签和实体标签进行前后序列整理,给出按照主题内容的对话句子集切割子集。在其中一个实施例中,所述主题情感识别模块具体包括:句子情感识别单元,通过一个预先训练的文本情感分类器或者关键词模型,判别主题语料句子集的每个句子的情感;综合情感判别单元,该单元通过统计、向量分析以及序列挖掘算法,判断不同角色对当前主题的情感倾向。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一项所述的方法。本专利技术的有益效果:通过主题切割模块将用户间的对话语料切割成多个主题语料集合,主题情感识别模块分析主题语料集得到各角色主题情感倾向并通过情感倾向序列挖掘模块获得角色间对话情感,实现通过对话发现用户间情感倾向以及变化过程。附图说明图1为根据本专利技术实施例的对话情感分析系统的结构示意图。图2为根据本专利技术实施例的对话情感分析方法示意性流程图。图3为根据本专利技术实施例的对话主题切割算法示意性流程图。图4为根据本专利技术实施例的主题情感识别算法示意性流程图。图5为根据本专利技术实施例中的情感序列示例图。图6为根据本专利技术实施例中的对话情感矩阵示例图。具体实施方式下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。参阅图1,一种对话情感分析系统100,包括:主题切割模块110,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;主题情感识别模块120,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;情感序列挖掘模块130,对主体情感识别算法给出的每个角色主题情感对进行挖掘,最终给出角色间情感结果。在其中一个实施例中,所述主题切割模块具体包括:LDA主题分类单元,对每个句子进行内容主题识别,得到每个句子的最高可能主题候选;名实体识别单元,对每个句子分析得到实体候选;题融合切割单元,对LDA主题分类单元和命名实体识别单元得到的句子主题标签和实体标签进行前后序列整理,给出按照主题内容的对话句子集切割子集。在其中一个实施例中,所述主题情感识别模块具体包括:句子情感识别单元,通过一个预先训练的文本情感分类器或者关键词模型,判别主题语料句子集的每个句子的情感;综合情感判别单元,该单元通过统计、向量分析以及序列挖掘算法,判断不同角色对当前主题的情感倾向。以下结合图2到图6详细说明根据本专利技术实施例的对话情感分析方法。应理解,图2至图6展示了对话情感分析方法的详细的步骤或操作,但这些步骤或操作仅是示例,本专利技术实施例还可以执行其他操作或者图2至图4的各种操作的变化。此外,图2至图4中各个步骤或者数据通信顺序可以呈现不同的过程来执行,并且有可能并非要执行图2至图4中的全部操作。图2是从主题切割、主题情感识别及情感序列挖掘的角度描述的对话情感分析方法200的示意性流程图。该方法200可以用于聊天语料的情感分析,该方法200可以用于包含对话主题切割、主题情感识别和情感序列分析的对话情感分析系统中,其中对话主题切割算法210得到的主题语料集传输给主题情感识别算法220,主题情感序列挖掘算法230对角色主题情感结果进行序列挖掘输出角色间情感结果矩阵。如图2所示,该方法200包括:S210,主题切割算法分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集。如,原始对话语料句子集"Sens={A:Sen1,B:Sen2,B:Sen3,A:Sen4,...,B:Senm}"表示角色A和角色B之间的对话内容,其中“A:Sen1”表示角色“A”说了句子“Sen1”,然后是“B:Sen2”表示角色“B”说了句子“Sen2”,总的聊天记录含有“m”个句子。主题切割算法S210将原始对话语料句子集"Sens"切割成n个主题"{T1,T2,本文档来自技高网...

【技术保护点】
1.一种对话情感分析方法,其特征在于,包括:主题切割算法,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;主题情感识别算法,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;情感序列挖掘算法,对主体情感识别算法给出的每个角色主题情感对进行挖掘,最终给出角色间情感结果。

【技术特征摘要】
1.一种对话情感分析方法,其特征在于,包括:主题切割算法,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;主题情感识别算法,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;情感序列挖掘算法,对主体情感识别算法给出的每个角色主题情感对进行挖掘,最终给出角色间情感结果。2.如权利要求1所述的对话情感分析方法,其特征在于,“主题切割算法,分析对话语料句子集,对每个对话内容进行主题识别,然后根据句子间的主题相关性将原始对话语料句子集切分为多个主题语料集;”具体包括:LDA主题分类算法,对每个句子进行内容主题识别,得到每个句子的最高可能主题候选;名实体识别算法,对每个句子分析得到实体候选;题融合切割算法,对LDA主题分类算法和命名实体识别算法得到的句子主题标签和实体标签进行前后序列整理,给出按照主题内容的对话句子集切割子集。3.如权利要求1所述的对话情感分析方法,其特征在于,“主题情感算法,对某个对话语料主题,分析不同角色每一句对当前主题的情感倾向,然后通过融合算法得到不同角色对当前主题的不同情感倾向;”具体包括:句子情感识别算法,通过一个预先训练的文本情感分类器或者关键词模型,判别主题语料句子集的每个句子的情感;综合情感判别算法,该算法通过统计、向量分析以及序列挖掘算法,判断不同角色对当前主题的情感倾向。4.一种对话情感分析系统,其特征在于,包括:主题切割模块,分析对话语料句子集,对...

【专利技术属性】
技术研发人员:李华康方浪徐梦婷孔令军许丽华
申请(专利权)人:苏州派维斯信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1