本发明专利技术涉及一种基于信息交互的语音识别方法,其包括步骤,采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类;将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息;对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型;利用语义处理模块对关键词序列进行识别,以执行语音命令信息的命令。本发明专利技术还提供一种存储介质及基于信息交互的语音识别系统,本发明专利技术提供的基于信息交互的语音识别方法、存储介质及系统可适配用户的语音命令输入习惯,增加用户使用体验。增加用户使用体验。增加用户使用体验。
【技术实现步骤摘要】
一种基于信息交互的语音识别方法、存储介质及系统
[0001]本专利技术涉及语音识别领域,尤其涉及一种基于信息交互的语音识别方法、存储介质及系统。
技术介绍
[0002]近年来,语音识别技术取得显著进步,开始从实验室走向市场,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。同样,随着大数据产业的蓬勃发展,很多企业都开始应用数据可视化。把大量的历史数据、实时数据进行应用处理,形象化、抽象化,从数据中分析业务、决策和规划,让数据迭代推动企业的发展和进步。
[0003]目前国内多数语音识别的方式,只会设定一些基础且固定的指令,用户在使用语音进行信息交互时,必须使用提前设定好的语言进行输入,且发音必须清楚明白,语句必须完整,否则会存在无法识别或识别设备无反应的情况。
[0004]在日常生活中,人们进行语音输入时,通常不会习惯于按照固定形式的语句进行输入,且在输入语音命令时,有时候习惯于一句话里同时带有多个命令,也有可能造成语音命令识别错误或顺序识别混乱。即,现有的语音识别技术里,无法很好适配人类的行为习惯。
技术实现思路
[0005]有鉴于此,本专利技术提供一种基于信息交互的语音识别方法、存储介质及系统解决现有语音识别技术无法很好的适配人类行为习惯的问题。
[0006]为了达到上述目的,本专利技术解决技术问题的技术方案是提供一种基于信息交互的语音识别方法,其包括步骤:采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类;将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息;对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型;利用语义处理模块对关键词序列进行识别,以执行语音命令信息的命令。
[0007]进一步,所述采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类包括步骤:采集多份语音命令信息;将多份语音命令信息按照实际意义分类。
[0008]进一步,所述将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息包括步骤:将分类后的语音命令信息分别转换为分段文本信息;将分段文本信息按照输入的时间进行排列。
[0009]进一步,所述对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型包括步骤:将分段文本信息作为输入,以语音命令信息的实际意义作为结果进行训练,形成文本识别模型;利用文本识别模型选取分段文本中的关键词;将关键词按照时间的顺序进行
排列,形成关键词序列。
[0010]进一步,所述利用语义处理模块对关键词序列进行识别,以执行语音命令信息的命令包括步骤:将关键词序列输入语义处理模块;语义处理模块将关键词序列转换为具体执行的命令。
[0011]进一步,所述分段本文信息为单个字节。
[0012]进一步,所述语义处理模块采用LSTM、CNN或者Transformer中的任一种。
[0013]本专利技术还提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行基于信息交互的语音识别方法。
[0014]本专利技术还提供一种基于信息交互的语音识别系统,其包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现基于信息交互的语音识别方法。
[0015]与现有技术相比,本专利技术所提供的基于信息交互的语音识别方法、存储介质及系统具有以下有益效果:
[0016]通过多份不同用户的语音命令信息作为输入样本,利用机器学习训练出语音命令信息转换成分段文本信息后,能够从分段文本信息中提取关键词的本文识别模型。利用文本识别模型的功能,可使用户在输入语音命令信息的时候,不用完全按照语音输入的模板式方法进行输入,提高了用户的使用体验。
[0017]以上所述本专利技术的具体实施方式,并不构成对本专利技术保护范围的限定。任何根据本专利技术的技术构思所做出的各种其他相应的改变与变形,均应包含在本专利技术的保护范围内。
附图说明
[0018]图1为本专利技术第一实施例提供的一种基于信息交互的语音识别方法的流程示意图;
[0019]图2为图1中步骤S1的子步骤流程图;
[0020]图3为图1中步骤S2的子步骤流程图;
[0021]图4为图1中步骤S3的子步骤流程图;
[0022]图5为图1中步骤S4的子步骤流程图。
具体实施方式
[0023]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0024]请参阅图1,本专利技术提供的一种基于信息交互的语音识别方法,其包括步骤:
[0025]S1,采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类;
[0026]具体的,收集多份用户的语音命令信息,然后将多份语音命令信息按照其实际的意义进行分裂,即,将语音命令信息表达的意思相同的分成一类。
[0027]可以理解,由于每个用户表达同一种意思所用的语句习惯不一样,如有的用户习惯按照正常的语序进行语音输入,有的用户习惯使用倒装句,再比如有的用户进行语音输
入时只说关键词,而有的用户进行语音输入时习惯输入多个与实际意义无关的词汇如“恩、哦、啊”等,但是实际上这些用户所表达的实际意义是一致的。那么,就将这些实际意义相同的作为一个分类。
[0028]S2,将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息;
[0029]具体的,在将上述语音命令信息分类后,将每个种类的语音命令信息都按照其输入语音命令信息的时间顺序转换成分段的文本信息。如其中一个种类的一端语音命令信息为“我想听音乐”,将其转换为分段文本信息即为五个文本,并按照“我想听音乐”的顺序排列。
[0030]可以理解,对语音命令信息转换时,所转换的分段文本为单个字节,如“我想听音乐”被转换成一段由“我”“想”“听”“音”“乐”五个文本组成的文本信息,并按照用户输入语音命令信息时的顺序排列。
[0031]S3,对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型;
[0032]具体的,将语音命令信息转换成分段文本后,将同种类的多个分段当做输入,以该语音命令信息实际意义对应的关键词作为结果进行训练,以形成可以根据输入的分段文本信息,输出关检测的文本识别模型。如,当输入的是“我”“想”“听”“音”“乐”时,其语音命令信息的实际意义为打开音乐播放器,所以其实际对应的关键词为“听”“音”“乐”,而“我”“想”这两个关键词为干扰词,在输出时可将其剔除。在文本识别模型提取出关键词后,将其按照时间顺序进行排序,形本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于信息交互的语音识别方法,其特征在于,包括步骤:采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类;将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息;对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型;利用语义处理模块对关键词序列进行识别,以执行语音命令信息的命令。2.如权利要求1所述的一种基于信息交互的语音识别方法,其特征在于,所述采集多份语音命令信息,将多份语音命令信息按照其实际意义进行分类包括步骤:采集多份语音命令信息;将多份语音命令信息按照实际意义分类。3.如权利要求1所述的一种基于信息交互的语音识别方法,其特征在于,所述将不同种类实际的语音命令信息分别按照时间顺序转换成分段文本信息包括步骤:将分类后的语音命令信息分别转换为分段文本信息;将分段文本信息按照输入的时间进行排列。4.如权利要求1所述的一种基于信息交互的语音识别方法,其特征在于,所述对按照时间顺序转换成的同种类分段文本信息进行机器学习训练,以得到可从分段文本信息中提取关键词,并以时间顺序形成关键词序列的文本识别模型包括步骤:将分段文本信息作为输入,...
【专利技术属性】
技术研发人员:贺昌茂,彭荣,
申请(专利权)人:武汉海昌信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。