一种智能语音交互系统及方法技术方案

技术编号:37716377 阅读:11 留言:0更新日期:2023-06-02 00:12
本发明专利技术公开了一种智能语音交互系统及方法,涉及语音交互领域,包括数据采集模块、数据处理模块、数据分析模块、数据中心、执行模块和控制中心,本发明专利技术通过将采集的模拟声音信号模数转换为数字声音信号,提取数字声音信号特征获得特征参数,对特征参数进行标记及计算得到第一判定参数,设定标准判定参数,对第一判定参数和标准判定参数分别一阶求导,计算二者差值绝对值,将结果与设定的差值阈值比较判断是否符合控制标准以实现噪音过滤,再对符合控制标准的数字声音信号进行音色匹配,以识别不同用户,解析用户自然语言并结合用户以往问答记录相关性消除信息差异,本发明专利技术可有效识别有效发声并对发声用户辨识并访问历史记录,优化人机交互体验。机交互体验。机交互体验。

【技术实现步骤摘要】
一种智能语音交互系统及方法


[0001]本专利技术涉及智能语音控制
,具体的是一种智能语音交互系统及方法。

技术介绍

[0002]语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,随着科技的发展,智能语音系统被越来越多的应用到各行各业,目前用于展览的智能语音导览,是通过对室内展览物件进行语音播报讲解,以便于参观者对展览物品进行深入了解的装置,其在语音导览的领域中得到了广泛的使用。
[0003]智能语音导览具备人机交互功能,能够在一定范围内收录人声,分析语音语义,并进行交流;但目前常见的智能语音导览不具备复杂环境下的语音准确识别能力,容易受到外界干扰导致分不清人声与干扰音,尤其涉及展览领域的智能语音导览,因其工作环境声音嘈杂且多样,极易受到干扰导致影响其语音交互功能。
[0004]此外,在展览特殊场景下,智能语音导览也很难做到根据不同用户的语音特征识别不同用户,无法提供用户个性化交流服务,从而导致展览场景下用户的交互体验不佳。

技术实现思路

[0005]为解决上述
技术介绍
中提到的不足,本专利技术的目的在于提供一种智能语音交互系统及方法。
[0006]本专利技术的目的可以通过以下技术方案实现:第一方面,本专利技术提供了一种智能语音交互系统,包括数据采集模块、数据处理模块、数据分析模块、数据中心、执行模块和控制中心;所述数据中心包含音色数据库、噪音数据库、通用问答库及用户问答库;所述数据采集模块:采集模拟声音信号,并且将采集到的所述模拟声音信号发送至所述数据处理模块进行数据处理;所述数据处理模块:利用模数转换将所述模拟声音信号转换为数字声音信号,将转换后的数字声音信号进行特征提取,得到数字声音信号的特征参数,其中,所述数字声音信号的特征参数包括数字声音信号的分贝、速度、音调和音色,对所述数字声音信号的特征参数进行标记,并发送至所述数据分析模块进行分析;所述数据分析模块:利用所述数字声音信号的特征参数中数字声音信号的分贝、速度和音调进行计算得到第一判定参数,并设定标准判定参数,对所述第一判定参数和所述标准判定参数进行一阶求导,求一阶求导后的所述第一判定参数的一阶导数和所述标准判定参数的一阶导数的绝对值之差,得到判定差值;将所述判定差值与预设的差值阈值进行比较,若所述判定差值大于或等于所述差值阈值,判断采集声音的数字声音信号不符合控制标准,所述噪音数据库收录所述数字声音信号;若所述判定差值小于所述差值阈值,判断采集声音的数字声音信号符合控制标准,所述控制中心过滤所述噪音数据库收录的数字声音信号,并分析过滤后的所述数字声音信号的音色;将所述数字声音信号的音色与所述音色数据库中存储的用户音色参数集内的用户音色进行匹配:若匹配成功,根据所述数字声音信号解析用户NLP自然语言,所述
控制中心遍历所述用户问答库的历史问答记录,根据解析用户NLP自然语言结果与所述用户问答库的历史问答记录的内容的相关性消除信息差异,获得最终语言处理结果,并根据所述最终语言处理结果生成解答内容进行交互,所述执行模块执行交互指令;若匹配失败,根据所述数字声音信号解析用户NLP自然语言,所述控制中心访问所述通用问答库,调用所述通用问答库的数据进行解答,所述执行模块执行交互指令,同时生成该用户的用户问答库的历史问答记录,将本次问答内容收录入所述用户问答库。
[0007]优选地,所述数据处理模块进行数据处理的过程包括以下步骤:利用模数转换将所述模拟声音信号转换为数字声音信号,将转换后的所述数字声音信号进行特征提取,得出所述数字声音信号的特征参数,其中,所述数字声音信号的特征参数包括数字声音信号的分贝、速度、音调和音色,对所述数字声音信号的特征参数进行标记,将所述数字声音信号的分贝标记为F
by
,将所述数字声音信号的速度标记为S
dy
,将所述数字声音信号的音调标记为G
dy
,将所述数字声音信号的音色标记为Y
sy
,其中,y为采集次数标号,且y=1、2、3、...、n,n为采集次数总数;将所述数字声音信号的分贝F
by
、所述数字声音信号的速度S
dy
、所述数字声音信号的音调G
dy
和所述数字声音信号的音色Y
sy
发送至所述数据分析模块进行数据分析。
[0008]优选地,所述数据分析模块进行数据分析的过程包括以下步骤:利用公式计算得出第一判定参数P
dy
,式中,F
b0
为标准声音分贝参数,S
d0
为标准声音速度参数,G
d0
为标准声音音调参数,α为声音分贝影响参数,β为声音速度影响参数,γ为声音音调影响参数,为预设比例系数;利用计算得出的第一判定参数P
dy
获取判定参数的一阶导数P
dy1
,并设定标准判定参数P
db
,并对所述标准判定参数P
db
进行一阶求导,得出所述标准判定参数的一阶导数P
db1
;计算所述第一判定参数的一阶导数P
dy1
和所述标准判定参数的一阶导数P
db1
的绝对值之差,公式为:,得出差值Cz,并且与预设的所述差值阈值Cz0进行比较,若Cz≥Cz0,则说明采集声音的数字声音信号不符合控制标准,所述噪音数据库收录所述数字声音信号;若Cz<Cz0,则说明采集的声音符合控制标准,所述控制中心过滤所述噪音数据库收录的数字声音信号,并分析过滤后的所述数字声音信号的音色;通过所述数据分析模块内的数据采集单元获取所述音色数据库中存储的用户音色参数集Y
sbp
,并将所述数字声音信号的音色Y
sy
与所述用户音色参数集Y
sbp
内的用户音色参数进行参数匹配,若所述数字声音信号的音色Y
sy
匹配成功,根据所述数字声音信号解析用户NLP自然语言,所述控制中心遍历所述用户问答库的历史问答记录,根据解析用户NLP自然语言结果与所述用户问答库的历史问答记录的内容的相关性消除信息差异,获得最终语言处理结果,并根据所述最终语言处理结果生成解答内容进行交互,所述执行模块执行交互指令;若数字声音信号的音色Y
sy
匹配失败,根据所述数字声音信号解析用户NLP自然语言,所述控制中心访问所述通用问答库,调用所述通用问答库的数据进行解答,所述执行模块执行交互指令,同时生成该用户的用户问答库的历史问答记录,将本次问答内容收录入所述用户问答库。
[0009]优选地,所述用户音色参数集Y
sbp
={Y
sb1
、Y
sb2
、Y
sb3
、...、Y
sbt
},其中p为用户标号,t
为用户人数总数。
[0010]优选地,所述用户音色参数集Y
sbp
的获取过程如下:通过所述控制中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能语音交互系统,其特征在于,包括数据采集模块、数据处理模块、数据分析模块、数据中心、执行模块和控制中心;所述数据中心包含音色数据库、噪音数据库、通用问答库及用户问答库;所述数据采集模块:采集模拟声音信号,并且将采集到的所述模拟声音信号发送至所述数据处理模块进行数据处理;所述数据处理模块:利用模数转换将所述模拟声音信号转换为数字声音信号,将转换后的数字声音信号进行特征提取,得到数字声音信号的特征参数,其中,所述数字声音信号的特征参数包括数字声音信号的分贝、速度、音调和音色,对所述数字声音信号的特征参数进行标记,并发送至所述数据分析模块进行分析;所述数据分析模块:利用所述数字声音信号的特征参数中数字声音信号的分贝、速度和音调进行计算得到第一判定参数,并设定标准判定参数,对所述第一判定参数和所述标准判定参数进行一阶求导,求一阶求导后的所述第一判定参数的一阶导数和所述标准判定参数的一阶导数的绝对值之差,得到判定差值;将所述判定差值与预设的差值阈值进行比较,若所述判定差值大于或等于所述差值阈值,判断采集声音的数字声音信号不符合控制标准,所述噪音数据库收录所述数字声音信号;若所述判定差值小于所述差值阈值,判断采集声音的数字声音信号符合控制标准,所述控制中心过滤所述噪音数据库收录的数字声音信号,并分析过滤后的所述数字声音信号的音色;将所述数字声音信号的音色与所述音色数据库中存储的用户音色参数集内的用户音色进行匹配:若匹配成功,根据所述数字声音信号解析用户NLP自然语言,所述控制中心遍历所述用户问答库的历史问答记录,根据解析用户NLP自然语言结果与所述用户问答库的历史问答记录的内容的相关性消除信息差异,获得最终语言处理结果,并根据所述最终语言处理结果生成解答内容进行交互,所述执行模块执行交互指令;若匹配失败,根据所述数字声音信号解析用户NLP自然语言,所述控制中心访问所述通用问答库,调用所述通用问答库的数据进行解答,所述执行模块执行交互指令,同时生成该用户的用户问答库的历史问答记录,将本次问答内容收录入所述用户问答库。2.根据权利要求1所述的一种智能语音交互系统,其特征在于,所述数据处理模块进行数据处理的过程包括以下步骤:利用模数转换将所述模拟声音信号转换为数字声音信号,将转换后的所述数字声音信号进行特征提取,得出所述数字声音信号的特征参数,其中,所述数字声音信号的特征参数包括数字声音信号的分贝、速度、音调和音色;对所述数字声音信号的特征参数进行标记,将所述数字声音信号的分贝标记为F
by
,将所述数字声音信号的速度标记为S
dy
,将所述数字声音信号的音调标记为G
dy
,将所述数字声音信号的音色标记为Y
sy
,其中,y为采集次数标号,且y=1、2、3、...、n,n为采集次数总数;将所述数字声音信号的分贝F
by
、所述数字声音信号的速度S
dy
、所述数字声音信号的音调G
dy
和所述数字声音信号的音色Y
sy
发送至所述数据分析模块进行数据分析。3.根据权利要求2所述的一种智能语音交互系统,其特征在于,所述数据分析模块进行
数据分析的过程包括以下步骤:利用公式计算得出第一判定参数P
dy
,式中,F
b0
为标准声音分贝参数,S
d0
为标准声音速度参数,G
d0
为标准声音音调参数,α为声音分贝影响参数,β为声音速度影响参数,γ为声音音调影响参数,为预设比例系数;利用计算得出的第一判定参数P
dy
获取第一判定参数的一阶导数P
dy1
,并设定标准判定参数P
db
,并对所述标准判定参数P
db
进行一阶求导,得出所述标准判定参数的一阶导数P
db1
;计算所述第一判定参数的一阶导数P
dy1
和所述标准判定参数的一阶导数P
db1
的绝对值之差,公式为:,得出差值Cz,并且与预设的所述差值阈值Cz0进行比较,若Cz≥Cz0,则说明采集声音的数字声音信号不符合控制标...

【专利技术属性】
技术研发人员:李广鹏周林娜
申请(专利权)人:北京水晶石数字科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1