一种基于语音识别的人工智能系统技术方案

技术编号:29794337 阅读:16 留言:0更新日期:2021-08-24 18:14
本发明专利技术公开了一种基于语音识别的人工智能系统,利用数据采集模块采集语音信息;利用数据定位模块获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息;利用数据分析模块接收语音信息进行分析,得到语音分析信息,并将语音分析信息发送至数据识别模块;利用数据处理模块接收位置信息和语音分析信息并进行处理,得到识别信息;利用识别模块接收识别信息并进行分析,得到识别结果;利用提示对话模块根据识别结果进行语音提示和对话;利用数据传输模块对各个模块之间的数据进行传输;本发明专利技术用于解决不能根据语音的发送位置和语音数据进行分析和筛选导致回复的准确性差的问题。

【技术实现步骤摘要】
一种基于语音识别的人工智能系统
本专利技术涉及人工智能
,尤其涉及一种基于语音识别的人工智能系统。
技术介绍
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术;语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面;根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别,关键词识别和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。公开号CN108831483A公开了一种人工智能语音识别系统,终端唤醒模块获取采集的语音信息并进行标记;声源定位模块根据麦克风的位置坐标和声音强度计算声源位置;语音采集定位模块根据声源位置坐标生成声源相对于机器人终端的相对位置坐标并得到声源方向;第二语音采集装置存储获取的命令语音;命令识别模块输出检测信号。该专利技术通过识别第一关键字启动系统,并通过识别第二关键字对扫地机器人下达命令,使得扫地机器人可以通过语音指令到达指定地点,系统智能方便,为居家生活提供更多便利。现有的基于语音识别的人工智能系统存在的缺陷是:不能根据语音的发送位置和语音数据进行分析和筛选导致回复的准确性差的问题。
技术实现思路
本专利技术的目的在于提供一种基于语音识别的人工智能系统,本专利技术所要解决的技术问题为:如何解决现有方案中不能根据语音的发送位置和语音数据进行分析和筛选导致回复的准确性差的问题。本专利技术的目的可以通过以下技术方案实现:一种基于语音识别的人工智能系统,包括数据采集模块、数据传输模块、数据定位模块、数据分析模块、数据处理模块、识别模块和提示对话模块;所述数据采集模块用于采集语音信息,该语音信息包含语音强度数据、语音振幅数据、语音内容数据和语音持续时间,通过数据传输模块将语音信息发送至数据分析模块;所述数据定位模块用于获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息,通过数据传输模块将位置信息发送至数据识别模块;所述数据分析模块用于接收语音信息进行分析,得到语音分析信息,并将语音分析信息发送至数据识别模块;所述数据处理模块用于接收位置信息和语音分析信息并进行处理,得到识别信息,具体的步骤包括:步骤一:接收位置信息和语音分析信息,获取位置信息中的正偏排序集和语音分析信息中的发接排序集;步骤二:利用公式获取语音的关联值,该公式为:其中,Qgl表示为语音的关联值,η表示为预设的关联修正因子,b1、b2表示为不同的比例系数,ZPk表示为正偏排序集,FJk表示为发接排序集,ZPk0表示为正偏排序集的均值,FJk0表示为发接排序集的均值,k=1,2,3;步骤三:将关联值与预设的标准关联范围进行匹配,若关联值属于标准关联范围,则判定该关联值为有效关联,并将该关联值对应的语音标记为有效语音;若关联值不属于标准关联范围,则判定该关联值为无效关联,并将该关联值对应的语音标记为无效语音;步骤四:获取有效语音对应的语音强度数据、语音振幅数据、语音内容数据以及语音坐标并进行组合,得到识别信息;所述识别模块用于接收识别信息并进行分析,得到识别结果,将识别结果发送至提示对话模块;所述提示对话模块用于根据识别结果进行语音提示和对话;所述数据传输模块用于对各个模块之间的数据进行传输。优选的,所述数据定位模块用于获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息,具体的步骤包括:S21:获取语音的发音源坐标与麦克风的接收端坐标,将接收端坐标标记为第一坐标,并以第一坐标为原点建立坐标系,将第一坐标的正前方设定为横坐标轴,将第一坐标的正右方设定为纵坐标轴,将发音源坐标标记为第二坐标;S22:计算第二坐标与第一坐标之间的距离并标记为传输距离CJ,设定不同的距离均对应一个不同的距离预设值,将传输距离与所有的距离进行匹配获取对应的距离预设值并标记为JLYi,i=1,2...n;S23:计算第二坐标与第一坐标之间的夹角并标记为传输夹角,设定不同的夹角均对应一个不同的夹角预设值,将传输夹角与所有的夹角进行匹配获取对应的夹角预设值并标记为JJYi,i=1,2...n;S24:利用公式获取语音的正偏值,该公式为:其中,Qzp表示为语音的正偏值,μ表示为预设的传输修正因子,a1、a2表示为不同的比例系数;S25:将正偏值进行升序排列,并将排序前三的正偏值标记为待选正偏值并组合,得到正偏排序集;S26:将第一坐标、第二坐标、正偏排序集、夹角预设值和坐标系组合,得到位置信息。优选的,所述数据分析模块用于接收语音信息进行分析,得到语音分析信息,具体的步骤包括:S31:获取语音信息中的语音强度数据、语音振幅数据、语音内容数据和语音持续时间,设定不同的语音强度均对应一个不同的强度预设值,将语音强度数据与所有的语音强度进行匹配获取对应的强度预设值并标记为QYi,i=1,2...n;S32:设定不同的语音振幅均对应一个不同的振幅预设值,将语音振幅数据与所有的语音振幅进行匹配获取对应的振幅预设值并标记为ZYi,i=1,2...n;S33:获取语音持续时间并进行归一化处理并取其值并标记为CSi,i=1,2...n;S34:利用公式获取语音的发接值,该公式为:其中,Qfj表示为语音的发接值,β表示为预设的发接修正因子,g1、g2、g3表示为不同的比例系数;S35:将发接值进行降序排列,并将排序前三的发接值标记为待选发接值并组合,得到发接排序集;S36:将强度预设值、振幅预设值、归一化的语音持续时间和发接排序集组合,得到语音分析信息。优选的,所述识别模块用于接收识别信息并进行分析,得到识别结果,具体的步骤包括:S41:接收识别信息获取有效语音对应的语音强度数据、语音振幅数据、语音内容数据以及语音坐标;S42:将有效语音对应的语音强度数据标记为有效强度,将有效语音对应的语音振幅数据标记为有效振幅,将有效语音对应的语音内容数据标记为有效内容,将有效语音对应的语音坐标标记为有效坐标;S43:利用文本转换算法将有效内容进行转换,得到有效文本;S44:利用公式x=Wi/W0获取有效文本的匹配度x;其中,Wi表示为有效文本与预设的标准文本相同的字数,i=1,2...n;W0表示为标准文本的总字数;S45:将匹配度进行降序排列并将值最大的匹配度标记为有效匹配度,并将有效匹配度对应的标准文本标记为匹配文本,匹配文本和有效匹配度构成识别结果。优选的,所述提示对话模块用于根据识别结果进行语音提示和对话,包括:获取识别结果中的匹配文本以及匹配文本对应的文本回复,通过本文档来自技高网...

【技术保护点】
1.一种基于语音识别的人工智能系统,其特征在于,包括数据采集模块、数据传输模块、数据定位模块、数据分析模块、数据处理模块、识别模块和提示对话模块;/n所述数据采集模块用于采集语音信息,该语音信息包含语音强度数据、语音振幅数据、语音内容数据和语音持续时间,通过数据传输模块将语音信息发送至数据分析模块;/n所述数据定位模块用于获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息,通过数据传输模块将位置信息发送至数据识别模块;/n所述数据分析模块用于接收语音信息进行分析,得到语音分析信息,并将语音分析信息发送至数据识别模块;/n所述数据处理模块用于接收位置信息和语音分析信息并进行处理,得到识别信息,具体的步骤包括:/n步骤一:接收位置信息和语音分析信息,获取位置信息中的正偏排序集和语音分析信息中的发接排序集;/n步骤二:利用公式获取语音的关联值,该公式为:/n

【技术特征摘要】
20210112 CN 20211003691961.一种基于语音识别的人工智能系统,其特征在于,包括数据采集模块、数据传输模块、数据定位模块、数据分析模块、数据处理模块、识别模块和提示对话模块;
所述数据采集模块用于采集语音信息,该语音信息包含语音强度数据、语音振幅数据、语音内容数据和语音持续时间,通过数据传输模块将语音信息发送至数据分析模块;
所述数据定位模块用于获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息,通过数据传输模块将位置信息发送至数据识别模块;
所述数据分析模块用于接收语音信息进行分析,得到语音分析信息,并将语音分析信息发送至数据识别模块;
所述数据处理模块用于接收位置信息和语音分析信息并进行处理,得到识别信息,具体的步骤包括:
步骤一:接收位置信息和语音分析信息,获取位置信息中的正偏排序集和语音分析信息中的发接排序集;
步骤二:利用公式获取语音的关联值,该公式为:



其中,Qgl表示为语音的关联值,η表示为预设的关联修正因子,b1、b2表示为不同的比例系数,ZPk表示为正偏排序集,FJk表示为发接排序集,ZPk0表示为正偏排序集的均值,FJk0表示为发接排序集的均值,k=1,2,3;
步骤三:将关联值与预设的标准关联范围进行匹配,若关联值属于标准关联范围,则判定该关联值为有效关联,并将该关联值对应的语音标记为有效语音;若关联值不属于标准关联范围,则判定该关联值为无效关联,并将该关联值对应的语音标记为无效语音;
步骤四:获取有效语音对应的语音强度数据、语音振幅数据、语音内容数据以及语音坐标并进行组合,得到识别信息;
所述识别模块用于接收识别信息并进行分析,得到识别结果,将识别结果发送至提示对话模块;
所述提示对话模块用于根据识别结果进行语音提示和对话;
所述数据传输模块用于对各个模块之间的数据进行传输。


2.根据权利要求1所述的一种基于语音识别的人工智能系统,其特征在于,所述数据定位模块用于获取语音的发音源坐标与麦克风的接收端坐标并进行处理,得到位置信息,具体的步骤包括:
S21:获取语音的发音源坐标与麦克风的接收端坐标,将接收端坐标标记为第一坐标,并以第一坐标为原点建立坐标系,将第一坐标的正前方设定为横坐标轴,将第一坐标的正右方设定为纵坐标轴,将发音源坐标标记为第二坐标;
S22:计算第二坐标与第一坐标之间的距离并标记为传输距离CJ,设定不同的距离均对应一个不同的距离预设值,将传输距离与所有的距离进行匹配获取对应的距离预设值并标记为JLYi,i=1,2...n;
S23:计算第二坐标与第一坐标之间的夹角并标记为传输夹角,设定不同的夹角均对应一个不同的夹角预设值,将传输夹角与所有的夹角进行匹配获取对应的夹角预设值并标记为JJYi,i=1,2...n;
S24:利用公式获...

【专利技术属性】
技术研发人员:梁亚正
申请(专利权)人:智粤云广州数字信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1