语音文件的分析方法、装置及系统制造方法及图纸

技术编号:15748564 阅读:296 留言:0更新日期:2017-07-03 08:24
本发明专利技术提供了一种语音文件的分析方法、装置及系统,属于自然语言处理领域。其中,语音文件的分析方法包括:将语音文件转换为文本信息,对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性;利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果。本发明专利技术的技术方案通过对语音文件进行分析,能够得到用户对评价对象的真实评价。

【技术实现步骤摘要】
语音文件的分析方法、装置及系统
本专利技术涉及自然语言处理领域,特别是指一种语音文件的分析方法、装置及系统。
技术介绍
目前用户对产品的评价通常是通过文本来进行表达,但是在移动设备上输入文字很不方便,因此,一部分客户会因为输入文字的不方便而放弃对产品进行评价或者对产品的评价字数很少,导致产品的评价信息不完整;还有一部分用户因为不善于用文字来表达情绪而导致对产品的评价不精准,比如在用户采用反讽的语气对产品进行评价时,对文本的分析结果往往与用户的真实意图相反。综上所述,采用文本进行表达的方式不能真实地反映用户对产品的评价。为了真实地反映用户对产品的评价,用户可以通过语音来发表对产品的评论,以及表达用户此时的情绪,但是现有的语音分析技术只能简单地分析出用户的情绪,即用户是高兴还是愤怒等,而不能将用户的情绪与产品的属性结合起来,也就不能得到用户对产品属性的真实评价。
技术实现思路
本专利技术要解决的技术问题是提供一种语音文件的分析方法、装置及系统,通过对语音文件进行分析,能够得到用户对产品属性的真实评价。为解决上述技术问题,本专利技术的实施例提供技术方案如下:一方面,提供一种语音文件的分析方法,包括:将语音文件转换为文本信息,对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性;利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果。进一步地,所述对所述文本信息进行分析得到评价对象以及评价对象的第一评价结果包括:对文本信息进行分词和句法分析,从分析结果中至少识别出评价对象、情感词及情感词的修饰词,将情感词及其修饰词组成的情感短语作为所述评价对象的第一评价结果。进一步地,所述获取所述语音文件中与所述第一评价结果对应的语音评价片段包括:将所述语音文件与所述文本信息进行对齐,确定出所述情感短语对应的语音片段所在位置;根据所述语音片段的所在位置从所述语音文件中截取语音评价片段,所述语音评价片段至少包括所述语音片段。进一步地,所述语音评价片段的长度大于所述语音片段的长度。进一步地,所述对所述语音评价片段进行语音分析,得到情感极性包括:提取出所述语音评价片段的语音特征;将所述提取的语音特征输入预设的训练模型中,得到情感极性。进一步地,所述分析方法还包括:对多组数据进行训练生成所述训练模型,每组数据包括语音特征及其对应的情感极性。进一步地,所述语音特征包括:语音能量变化率和语音基频变化率。进一步地,所述提取出所述语音评价片段的语音特征包括:通过滑动窗口对所述语音评价片段的语音能量E和语音基频F0进行平滑,得到平滑后的语音基频和语音能量其中,滑动窗口的长度为w帧,F0(i)为所述语音评价片段中第i帧的语音基频,E(i)为所述语音评价片段中第i帧的语音能量,i不大于w;利用平滑后的语音基频和语音能量得到语音能量变化率和语音基频变化率进一步地,所述利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果包括:在所述情感极性为正时,得到与所述第一评价结果相同的第二评价结果;在所述情感极性为负时,得到与所述第一评价结果相反的第二评价结果。本专利技术实施例还提供了一种语音文件的分析装置,包括:转换模块,用于将语音文件转换为文本信息;分析模块,用于对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;处理模块,用于获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性;校正模块,用于利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果。进一步地,所述分析模块包括:分词和句法分析子模块,用于对文本信息进行分词和句法分析;识别子模块,用于从分析结果中至少识别出评价对象、情感词及情感词的修饰词,将情感词及其修饰词组成的情感短语作为所述评价对象的第一评价结果。进一步地,所述处理模块包括:对齐子模块,用于将所述语音文件与所述文本信息进行对齐,确定出所述情感短语对应的语音片段所在位置;截取子模块,用于根据所述语音片段的所在位置从所述语音文件中截取语音评价片段,所述语音评价片段至少包括所述语音片段。进一步地,所述处理模块包括:提取子模块,用于提取出所述语音评价片段的语音特征;输入子模块,用于将所述提取的语音特征输入预设的训练模型中,得到情感极性。进一步地,所述装置还包括:模型训练模块,用于对多组数据进行训练生成所述训练模型,每组数据包括语音特征及其对应的情感极性。进一步地,所述语音特征包括:语音能量变化率和语音基频变化率。进一步地,所述提取子模块包括:第一计算单元,用于通过滑动窗口对所述语音评价片段的语音能量E和语音基频F0进行平滑,得到平滑后的语音基频和语音能量其中,滑动窗口的长度为w帧,F0(i)为所述语音评价片段中第i帧的语音基频,E(i)为所述语音评价片段中第i帧的语音能量,i不大于w;第二计算单元,用于利用平滑后的语音基频和语音能量得到语音能量变化率和语音基频变化率进一步地,所述校正模块具体用于在所述情感极性为正时,得到与所述第一评价结果相同的第二评价结果;在所述情感极性为负时,得到与所述第一评价结果相反的第二评价结果。本专利技术实施例还提供了一种语音文件的分析系统,包括:输入设备,用于接收输入的语音文件;分析设备,用于将语音文件转换为文本信息,对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果,获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性,利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果;输出设备,用于输出所述第二评价结果。本专利技术的实施例具有以下有益效果:上述方案中,将语音文件转换为文本信息,对文本信息进行分析得到评价对象的第一评价结果,之后对与第一评价结果对应的语音评价片段进行语音分析,得到情感极性,再利用情感极性对第一评价结果进行校正,得到第二评价结果。本专利技术的技术方案不但能够对语音文件做细粒度的分析,得到评价对象及其对应的评价结果,还能够将语音分析与文本分析相结合,得到用户对评价对象的真实评价。附图说明图1为本专利技术实施例一语音文件的分析方法的流程示意图;图2为本专利技术实施例二语音文件的分析装置的结构框图;图3为本专利技术实施例三语音文件的分析系统的结构框图;图4为本专利技术实施例四语音文件的分析方法的流程示意图;图5为本专利技术实施例四截取语音评价片段的流程示意图;图6为本专利技术实施例四截取语音评价片段的具体示例。具体实施方式为使本专利技术的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本专利技术的实施例针对现有技术中语音分析技术只能简单地分析出用户的情绪,不能得到用户对产品属性的真实评价的问题,提供一种语音文件的分析方法、装置及系统,通过对语音文件进行分析,能够得到用户对产品属性的真实评价。实施例一本实施例提供一种语音文件的分析方法,如图1所示,包括:步骤101:将语音文件转换为文本信息;步骤102:对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;步骤103:获取所述语音文件中与所述第一评价结果对应的语音评价片段,本文档来自技高网...
语音文件的分析方法、装置及系统

【技术保护点】
一种语音文件的分析方法,其特征在于,包括:将语音文件转换为文本信息,对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性;利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果。

【技术特征摘要】
1.一种语音文件的分析方法,其特征在于,包括:将语音文件转换为文本信息,对所述文本信息进行分析至少得到评价对象以及评价对象的第一评价结果;获取所述语音文件中与所述第一评价结果对应的语音评价片段,对所述语音评价片段进行语音分析,得到情感极性;利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果。2.根据权利要求1所述的语音文件的分析方法,其特征在于,所述对所述文本信息进行分析得到评价对象以及评价对象的第一评价结果包括:对文本信息进行分词和句法分析,从分析结果中至少识别出评价对象、情感词及情感词的修饰词,将情感词及其修饰词组成的情感短语作为所述评价对象的第一评价结果。3.根据权利要求1所述的语音文件的分析方法,其特征在于,所述获取所述语音文件中与所述第一评价结果对应的语音评价片段包括:将所述语音文件与所述文本信息进行对齐,确定出所述情感短语对应的语音片段所在位置;根据所述语音片段的所在位置从所述语音文件中截取语音评价片段,所述语音评价片段至少包括所述语音片段。4.根据权利要求3所述的语音文件的分析方法,其特征在于,所述语音评价片段的长度大于所述语音片段的长度。5.根据权利要求1所述的语音文件的分析方法,其特征在于,所述对所述语音评价片段进行语音分析,得到情感极性包括:提取出所述语音评价片段的语音特征;将所述提取的语音特征输入预设的训练模型中,得到情感极性。6.根据权利要求5所述的语音文件的分析方法,其特征在于,所述分析方法还包括:对多组数据进行训练生成所述训练模型,每组数据包括语音特征及其对应的情感极性。7.根据权利要求5所述的语音文件的分析方法,其特征在于,所述语音特征包括:语音能量变化率和语音基频变化率。8.根据权利要求7所述的语音文件的分析方法,其特征在于,所述提取出所述语音评价片段的语音特征包括:通过滑动窗口对所述语音评价片段的语音能量E和语音基频F0进行平滑,得到平滑后的语音基频和语音能量其中,滑动窗口的长度为w帧,F0(i)为所述语音评价片段中第i帧的语音基频,E(i)为所述语音评价片段中第i帧的语音能量,i不大于w;利用平滑后的语音基频和语音能量得到语音能量变化率和语音基频变化率9.根据权利要求1所述的语音文件的分析方法,其特征在于,所述利用所述情感极性对所述第一评价结果进行校正,得到第二评价结果包括:在所述情感极性为正时,得到与所述第一评价结果相同的第二评价结果;在所述情感极性为负时,得到与所述第一评价结果相反的第二评价结果。10.一种语音文件的分析装置,其特征在于,包括:转换模块,用于将语音文件转换为文本信息;分析模块,用于对所述文本信息进行分析至少得到评价对象以及评价对象的第...

【专利技术属性】
技术研发人员:张佳师姜珊珊张光磊郑继川董滨
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1