融合情感识别的多方会话可视化方法和系统技术方案

技术编号：20548131 阅读：16 留言：0更新日期：2019-03-09 20:44

本发明专利技术提供了一种融合情感识别的多方会话可视化方法和系统，包括：把多方会话的录音分割为说话人交替的录音片段；将所述录音片段与预存的说话人的声纹进行比对，识别出所述录音片段中的不同说话人的语音；以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位；定义各个情感类别和对应的颜色，通过语音情感识别技术识别出各个语音处理单位中的情感类别；通过语音识别技术把所述语音处理单位转换成文字；根据语音处理单位所述对应的情感类别对所转换成的文字标注对应的颜色，并将同一说话人的标注颜色后的文字合并为同一段话，可实现高效、准确地将说话录音文件转换成文本的同时，记录相应的情感信息。

全部详细技术资料下载

【技术实现步骤摘要】
融合情感识别的多方会话可视化方法和系统
本专利技术涉及一种融合情感识别的多方会话可视化方法和系统。
技术介绍
在企业的呼叫中心，通话过程全程录音后形成录音文件，但这种录音文件转换成的文本无法记录说话人的情感信息。
技术实现思路
本专利技术的目的在于提供一种融合情感识别的多方会话可视化方法和系统。为解决上述问题，本专利技术提供一种融合情感识别的多方会话可视化方法，包括：基于说话人的语音识别技术，把多方会话的录音分割为说话人交替的录音片段；将所述录音片段与预存的说话人的声纹进行比对，识别出所述录音片段中的不同说话人的语音；以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位；定义各个情感类别和对应的颜色，通过语音情感识别技术识别出各个语音处理单位中的情感类别；通过语音识别技术把所述语音处理单位转换成文字；根据语音处理单位所述对应的情感类别对所转换成的文字标注对应的颜色，并根据识别出所述录音片段中的不同说话人的语音，将同一说话人的标注颜色后的文字合并为同一段话。进一步的，在上述方法中，基于说话人的语音识别技术，把多方会话的录音分割为说话人交替的录音片段，包括：基于BIC技术，把多方会话的录音分割为说话人交替的录音片段。进一步的，在上述方法中，以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位，包括：根据沉默相对于人声的分贝差；找出语音片段中讲话的停顿位置；删除语音片段中长时间沉默的片段；进而，把剩余的语音片段分割为不超过6秒的语音处理单位。进一步的，在上述方法中，所述情感类别包括：高兴、平静、生气、害怕和恐惧。进一步的，在上述方法中...

【技术保护点】
1.一种融合情感识别的多方会话可视化方法，其特征在于，包括：基于说话人的语音识别技术，把多方会话的录音分割为说话人交替的录音片段；将所述录音片段与预存的说话人的声纹进行比对，识别出所述录音片段中的不同说话人的语音；以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位；定义各个情感类别和对应的颜色，通过语音情感识别技术识别出各个语音处理单位中的情感类别；通过语音识别技术把所述语音处理单位转换成文字；根据语音处理单位所述对应的情感类别对所转换成的文字标注对应的颜色，并根据识别出所述录音片段中的不同说话人的语音，将同一说话人的标注颜色后的文字合并为同一段话。

【技术特征摘要】
1.一种融合情感识别的多方会话可视化方法，其特征在于，包括：基于说话人的语音识别技术，把多方会话的录音分割为说话人交替的录音片段；将所述录音片段与预存的说话人的声纹进行比对，识别出所述录音片段中的不同说话人的语音；以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位；定义各个情感类别和对应的颜色，通过语音情感识别技术识别出各个语音处理单位中的情感类别；通过语音识别技术把所述语音处理单位转换成文字；根据语音处理单位所述对应的情感类别对所转换成的文字标注对应的颜色，并根据识别出所述录音片段中的不同说话人的语音，将同一说话人的标注颜色后的文字合并为同一段话。2.如权利要求1所述的融合情感识别的多方会话可视化方法，其特征在于，基于说话人的语音识别技术，把多方会话的录音分割为说话人交替的录音片段，包括：基于BIC技术，把多方会话的录音分割为说话人交替的录音片段。3.如权利要求1所述的融合情感识别的多方会话可视化方法，其特征在于，以6秒作为处理单位，把所述语音片段继续进行切分，得到各个语音处理单位，包括：根据沉默相对于人声的分贝差；找出语音片段中讲话的停顿位置；删除语音片段中长时间沉默的片段；进而，把剩余的语音片段分割为不超过6秒的语音处理单位。4.如权利要求1所述的融合情感识别的多方会话可视化方法，其特征在于，所述情感类别包括：高兴、平静、生气、害怕和恐惧。5.如权利要求1所述的融合情感识别的多方会话可视化方法，其特征在于，将所述录音片段与预存的说话人的声纹进行比对，识别出所述录音片段中的不同说话人的语音，包括：基于微软的说话人识别技术，将所述录音片段与预存的说话人的声...

【专利技术属性】
技术研发人员：艾旭升，马兆鹏，凌霞，
申请(专利权)人：苏州工业职业技术学院，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人