一种基于人工智能的语音交互系统技术方案

技术编号:28209325 阅读:31 留言:0更新日期:2021-04-24 14:42
本发明专利技术公开了一种基于人工智能的语音交互系统,涉及人工智能技术领域,包括注册登录模块、控制器、数据库、数据采集模块、存储模块、语音识别模块、音频分析模块、语音库、输入模块以及分配管理模块;控制器用于对接收到的音频信息进行审核过滤,从而找出目标声纹;能够很好的识别想要识别的人的音频信息,识别精度高,同时在将目标音频信息发送至语音识别模块之前,音频分析模块结合元音间隔和元音强度判断目标音频信息的有效性,能够有效保证识别语音的清晰和准确,提高语音识别速度;分配管理模块用于接收未解决信号并分配对应的后台人员进行远程交互,能够根据用户的交互值合理分配后台人员进行远程交互,提高用户体验度。提高用户体验度。提高用户体验度。

【技术实现步骤摘要】
一种基于人工智能的语音交互系统


[0001]本专利技术涉及人工智能
,具体为一种基于人工智能的语音交互系统。

技术介绍

[0002]人工智能(ArtificialIntelligence),英文缩写为AI,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能在计算机领域内得到了愈加广泛的重视,并在机器人、经济政治决策、控制系统、仿真系统中得到了广泛的应用。
[0003]HCI是Human

ComputerInteraction的缩写,意思是人机交互,指人与计算机之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分。一直以来,人机交互都是优化利用电脑的一个重要问题。近几年,随着人工智能的爆发,人机交互发展突飞猛进。人机交互的总体趋势是向着以用户为中心、交互方式更加直观的方向发展。
[0004]然而,现有的语音交互系统,当语音识别现场比较嘈杂或者同时说话的人数较多时,无法很好的识别想要识别的人的语音,识别精度很低,不能保证识别语音清晰和准确,导致用户在语音咨询一些问题时,调控反应慢,影响使用感受,语音识别速度还有待提高;以及存在当用户没有得到满意答复时,无法合理分配后台人员进行远程交互的问题,影响用户体验度。

技术实现思路

[0005]针对现有技术存在的不足,本专利技术目的是提供一种基于人工智能的语音交互系统。本专利技术在当语音识别现场比较嘈杂或者同时说话的人数较多时,能够很好的识别想要识别的人的音频信息,识别精度高,同时在将目标音频信息发送至语音识别模块之前,结合元音间隔和元音强度判断目标音频信息的有效性,能够有效保证识别语音的清晰和准确,提高语音识别速度。
[0006]本专利技术的目的可以通过以下技术方案实现:
[0007]一种基于人工智能的语音交互系统,包括注册登录模块、控制器、数据库、数据采集模块、存储模块、语音识别模块、音频分析模块、语音库、输入模块以及分配管理模块;
[0008]所述数据采集模块与用户的移动终端通信连接;所述数据采集模块用于实时采集室内人员的声纹和音频信息,并将获取的声纹和音频信息发送至控制器,所述控制器用于对接收到的音频信息进行审核过滤后,将对应的目标音频信息传输至存储模块和语音识别模块;
[0009]所述音频分析模块用于获取目标音频信息,并在将目标音频信息发送至语音识别模块之前,判断目标音频信息的有效性;若有效,则将目标音频信息发送至语音识别模块;若无效,则重新采集音频信息;
[0010]所述语音识别模块用于利用控制器分配的目标音频信息进行语音识别产生分析文本,并将分析文本返回至控制器,所述控制器用于根据分析文本调取语音库数据并推送
至用户的移动终端;
[0011]所述输入模块与用户的移动终端通信连接;所述输入模块用于用户反馈评价信号至控制器,所述评价信号包括解决信号和未解决信号;
[0012]所述控制器用于接收解决信号和未解决信号并在接收到未解决信号时将未解决信号发送至分配管理模块;所述分配管理模块用于接收未解决信号并分配对应的后台人员进行远程交互。
[0013]进一步地,所述注册登录模块用于用户通过移动终端录入个人信息后进行注册登录成为注册人员,并将个人信息发送至控制器,所述个人信息包括姓名、性别、年龄、实名认证手机号码和身份证号码;所述控制器用于将注册人员的个人信息发送至数据库存储;所述控制器采用NLP算法进行语音训练并输出分析文本对应的结果;NLP算法进行语音训练产生的对应结果储存至语音库;所述数据采集模块与数据库通信连接,所述数据库用于存储每个注册人员的声纹特征,所述声纹特征与注册人员的身份信息进行关联。
[0014]进一步地,所述控制器对音频信息进行审核过滤的方法为:
[0015]步骤一:当采集到多个人员的音频信息时,通过声纹识别技术获取每个音频信息的声纹特征,将该声纹特征与数据库中存储的注册人员的声纹特征进行对比,找出相同的声纹,并将其标记为初选声纹;
[0016]步骤二:获取移动终端的手机号码,将移动终端的手机号码与数据库中存储的注册人员的实名认证手机号码进行对比,获取用户的身份信息和对应的声纹特征;将用户对应的声纹特征标记为标准声纹;
[0017]步骤三:将初选声纹与标准声纹进行对比,将与标准声纹一致的初选声纹标记为目标声纹;将该目标声纹对应的音频信息标记为目标音频信息。
[0018]进一步地,所述音频分析模块的具体分析步骤为:
[0019]SS1:对目标音频信息进行降噪增强处理;
[0020]SS2:获取目标音频信息中每个元音的采集时间并标记为T
i
;i=1,

,n;
[0021]利用公式C
i
=T
i+1

T
i
计算得到相邻两个元音的时间差并标记为单次间隔C
i

[0022]SS3:将单次间隔C
i
与间隔阈值进行对比;所述间隔阈值包括第一间隔阈值G1、第二间隔阈值G2;且G1<G2;
[0023]若C
i
≥G2时,则将该单次间隔标记为影响间隔;此时影响间隔对应的间隔阈值为第二间隔阈值G2;
[0024]若C
i
≤G1时,则将该单次间隔标记为影响间隔;此时影响间隔对应的间隔阈值为第一间隔阈值G1;
[0025]统计影响间隔出现的次数并标记为D1,将影响间隔与对应的间隔阈值进行差值计算得到偏隔值并标记为D2;
[0026]SS4:设定若干个偏隔系数,并标记为Kc;c=1,2,

,w;且K1<K2<

<Kw;每个偏隔系数Kc均对应一个预设偏隔值范围,依次分别为(k1,k2],(k2,k3],

,(kw,kw
+1
];且k1<k2<

<kw<kw+1;
[0027]当D2∈(kw,kw
+1
],则预设偏隔值范围对应的偏隔系数为Kw;
[0028]利用公式D3=D2
×
Kw获取得到偏隔值对应的影响值D3;将所有偏隔值对应的影响值进行求和得到偏隔影响总值,并标记为D4;
[0029]SS5:利用公式D5=D1
×
A1+D4
×
A2获取得到间隔影响值D5;其中A1、A2均为比例系数;
[0030]SS6:若间隔影响值D5<对应的间隔影响阈值,即目标音频信息有效,否则目标音频信息无效;
[0031]SS7:获取目标音频信息中每个元音的强度并标记为Q
i
,得到元音强度信息组;按照标准差计算公式计算得到实时Q
i
信息组的标准差α,当α小于预设值时,处于待验证状态;
[0032]SS8:当Q
i
处于待验证状态时,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的语音交互系统,其特征在于,包括注册登录模块、控制器、数据库、数据采集模块、存储模块、语音识别模块、音频分析模块、语音库、输入模块以及分配管理模块;所述数据采集模块与用户的移动终端通信连接;所述数据采集模块用于实时采集室内人员的声纹和音频信息,并将获取的声纹和音频信息发送至控制器,所述控制器用于对接收到的音频信息进行审核过滤后,将对应的目标音频信息传输至存储模块和语音识别模块;所述音频分析模块用于获取目标音频信息,并在将目标音频信息发送至语音识别模块之前,判断目标音频信息的有效性;若有效,则将目标音频信息发送至语音识别模块;若无效,则重新采集音频信息;所述语音识别模块用于利用控制器分配的目标音频信息进行语音识别产生分析文本,并将分析文本返回至控制器,所述控制器用于根据分析文本调取语音库数据并推送至用户的移动终端;所述输入模块与用户的移动终端通信连接;所述输入模块用于用户反馈评价信号至控制器,所述评价信号包括解决信号和未解决信号;所述控制器用于接收解决信号和未解决信号并在接收到未解决信号时将未解决信号发送至分配管理模块;所述分配管理模块用于接收未解决信号并分配对应的后台人员进行远程交互。2.根据权利要求1所述的一种基于人工智能的语音交互系统,其特征在于,所述注册登录模块用于用户通过移动终端录入个人信息后进行注册登录成为注册人员,并将个人信息发送至控制器,所述个人信息包括姓名、性别、年龄、实名认证手机号码和身份证号码;所述控制器用于将注册人员的个人信息发送至数据库存储;所述控制器采用NLP算法进行语音训练并输出分析文本对应的结果;NLP算法进行语音训练产生的对应结果储存至语音库;所述数据采集模块与数据库通信连接,所述数据库用于存储每个注册人员的声纹特征,所述声纹特征与注册人员的身份信息进行关联。3.根据权利要求1所述的一种基于人工智能的语音交互系统,其特征在于,所述控制器对音频信息进行审核过滤的方法为:步骤一:当采集到多个人员的音频信息时,通过声纹识别技术获取每个音频信息的声纹特征,将该声纹特征与数据库中存储的注册人员的声纹特征进行对比,找出相同的声纹,并将其标记为初选声纹;步骤二:获取移动终端的手机号码,将移动终端的手机号码与数据库中存储的注册人员的实名认证手机号码进行对比,获取用户的身份信息和对应的声纹特征;将用户对应的声纹特征标记为标准声纹;步骤三:将初选声纹与标准声纹进行对比,将与标准声纹一致的初选声纹标记为目标声纹;将该目标声纹对应的音频信息标记为目标音频信息。4.根据权利要求1所述的一种基于人工智能的语音交互系统,其特征在于,所述音频分析模块的具体分析步骤为:SS1:对目标音频信息进行降噪增强处理;SS2:获取目标音频信息中每个元音的采集时间并标记为T
i
;i=1,

,n;
利用公式C
i
=T
i+1

T
i
计算得到相邻两个元音的时间差并标记为单次间隔C
i
;SS3:将单次间隔C
i
与间隔阈值进行对比;所述间隔阈值包括第一间隔阈值G1、第二间隔阈值G2;且G1<G2;若C
i
≥G2时,则将该单次间隔标记为影响间隔;此时影响间隔对应的间隔阈值为第二间隔阈值G2;若C
i
≤G1时,则将该单次间隔标记为影响间隔;此时影响间隔对应的间隔阈值为第一间隔阈值G1;统计影响间隔出现的次数并标记为D1,将影响间隔与对应的间隔阈值进行差值计算得到偏隔值并标记为D2;SS4:设定若干个偏隔系数,并标记为Kc;c=1,2,

,w;且K1<K2<

<Kw;每个偏隔系数Kc均对应一个预设偏隔值范围,依次分别为(k1,k2],(k2,k3],

,(kw,kw+1];且k1<k2<

<kw<kw+1;当D2∈(kw,kw+1],则预设...

【专利技术属性】
技术研发人员:李本松许兵兵
申请(专利权)人:江西台德智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1