自由聊天场景下的语音识别方法及系统技术方案

技术编号:20007040 阅读:65 留言:0更新日期:2019-01-05 18:39
本发明专利技术涉及智能服务领域,具体涉及一种自由聊天场景下的语音识别方法及系统,自由聊天场景下的语音识别系统包括:命令判断模块和执行判断模块;命令判断模块用于判断采集到的用户语音信息中是否存在预设的触发关键词,若存在触发关键词,则判断触发关键词后面输入的语音信息中是否含有预设的执行命令,若该语音信息中含有执行命令,则将含有触发关键词的语音段和含有执行命令的语音段之间的所有语音信息组合成一个语音集发送给执行判断模块,执行判断模块接收到语音集后判断该语音集中触发关键词和执行命令在该语音集中的实际占比值,当实际占比值大于等于预设占比值时执行命令。

Speech Recognition Method and System in Free Chat Scene

The invention relates to the field of intelligent service, in particular to a speech recognition method and system in free chat scenario. The speech recognition system in free chat scenario includes: command judgment module and execution judgment module; command judgment module is used to judge whether there are preset trigger keywords in the collected user's voice information, and if there are trigger keywords, judge trigger switch. Whether there is a preset execution command in the voice information input after the keyword, if there is an execution command in the voice information, all voice information between the voice segment containing trigger keyword and the voice segment containing execution command will be combined into a voice set and sent to the execution judgment module. After receiving the voice set, the execution judgment module will judge whether the voice set triggers keywords and persistence. The actual proportion of line commands in the voice set is executed when the actual proportion is greater than or equal to the preset proportion.

【技术实现步骤摘要】
自由聊天场景下的语音识别方法及系统
本专利技术涉及智能服务领域,具体涉及一种自由聊天场景下的语音识别方法及系统。
技术介绍
随着社会的发展,人们的生活节奏越来越快,于是人们迫切的需要利用人工智能来减少手动操作时间。为了解决上述问题,公开号为CN107622767A的中国专利文件公开了一种语音控制方法与家电控制系统,所适用的家电系统包括多台电器设备,每台电器设备与云端控制器数据连接,其中多台电器设备中的至少一部分配置有语音采集装置,作为语音交互设备,并且家电系统的语音控制方法包括:多台语音交互设备分别利用各自的语音采集装置采集周围的语音信号;对采集到的语音信号进行识别,提取语音信号的信号参数并判断语音信号是否与预设的唤醒信号相匹配;由接收到与预设的唤醒信号相匹配的语音信号的语音交互设备向云端控制器发送其接收到的语音信号的信号参数,以供云端控制器根据语音信号的参数从语音交互设备选取出语音应答设备;云端控制器向语音应答设备下达进入语音应答状态的控制指令。上述方案通过判断语音信号是否和预设的唤醒信号相匹配来实现是否执行控制指令,采用这种方式来识别接收到的语音信号是否为唤醒信号存在这样的问题:在采集到用户语音信号时,若用户正在和其他人聊天而不小心说到与唤醒信号相匹配的语音,这时用户本意是无需上述系统执行语音信号相应的控制指令,但是系统会误判断为应该执行语音信息相应的控制指令。
技术实现思路
本专利技术的目的在于提供一种自由聊天场景下的语音识别系统,以解决现有系统在用户与他人聊天时误说到唤醒信号相关的语音信号时系统将误动作的问题。本专利技术提供的基础方案为:自由聊天场景下的语音识别系统,包括:命令判断模块和执行判断模块;命令判断模块用于判断采集到的用户语音信息中是否存在预设的触发关键词,若存在触发关键词,则判断触发关键词后面输入的语音信息中是否含有预设的执行命令,若该语音信息中含有执行命令,则将含有触发关键词的语音段和含有执行命令的语音段之间的所有语音信息组合成一个语音集发送给执行判断模块,执行判断模块接收到命令判断模块发送的语音集后判断该语音集中触发关键词和执行命令在该语音集中的实际占比值,当实际占比值大于等于预设占比值时执行命令。本专利技术的工作原理及优点在于:对用户说话的语音信息进行采集,命令判断模块对采集到的语音信息中是否存在触发关键词进行判断,若存在预设的触发关键词,才开始判断触发关键词后面的语音信息中是否含有预设的执行命令,若该语音信息中含有执行命令,则将含有触发关键词的语音段和含有执行命令的语音段之间的所有语音信息组合成一个语音集发送给执行判断模块,执行判断模块接收到命令判断模块发送的语音集后判断该语音集中触发关键词和执行命令在该语音集中的实际占比值,当实际占比值大于等于预设占比值时才执行命令。本方案中将实际占比值和预设占比值进行对比来判断是否执行相应的执行命令,而并不是只依赖于语音信息中是否有触发关键词或执行命令,与现有技术中只通过判断语音信号中是否存在唤醒信号来判断是否执行命令相比,本方案能有效的减少系统误执行命令的次数。比如,实际占比值的预设占比值限定为100%,用户需要系统执行某个命令时,直接输入触发关键词的语音信息后直接输入执行命令的语音信息,这时该触发关键词和执行命令在语音集中的实际占比值便是100%,则将执行该执行命令;若用户和他人在聊天,不小心说到触发关键词,且在后面的聊天内容中也提到了执行命令,而执行命令并不是在触发关键词输出后说到的,这时,触发关键词和执行命令之间便含有其余语音信息,触发关键词和执行命令在语音集中的实际占比值便小于100%,则不执行该执行命令。进一步,还包括执行模块和距离检测模块,距离检测模块用于检测与用户之间的位置距离值,然后将位置距离值发送给执行模块;执行模块接收到距离检测模块发送的位置距离值时,判断该位置距离值是否属于预设距离值范围内,若该位置距离值属于预设距离值范围内,且执行判断模块判断触发关键词和执行命令在语音集中的占比大于等于预设占比值,则执行模块按照该执行命令执行相应的动作。通过距离检测模块检测与用户之间的距离,而执行模块根据距离检测模块发送的位置距离值判断是否属于预设距离值范围内,若该位置距离值属于预设距离值范围内,且执行判断模块判断触发关键词和执行命令在语音集中的占比大于等于预设占比值,则执行模块才按照该执行命令执行相应的动作,进一步减小了系统误执行命令的次数。进一步,还包括等待处理模块,当执行判断模块判断触发关键词和执行命令在语音集中的占比小于预设占比值时,将该执行命令发送给等待处理模块,等待处理模块接收到执行判断模块发送的执行命令后对该执行命令进行存储,当该命令指令存储后又在预设时间范围内执行判断模块发送了同样的执行命令给执行模块,则将存储的执行命令清零;当该命令存储后在预设时间范围内执行判断模块又发送了同样的执行命令给等待处理模块,若发送次数超过两次,则等待处理模块将该执行命令发送给执行模块进行执行。通过等待处理模块的设置,能有效的避免用户在输入触发关键词的语音信息后因为其它事情的打断导致其没有在输出触发关键词后直接输入执行命令,这时,在预设时间范围内用户只需再次输入触发关键词和执行命令便能实现自由聊天场景下的语音识别系统对该执行命令的执行;在预设时间范围内若用户在第二次输入触发关键词后仍旧被打断,用户在预设时间范围内再次输入执行命令便可实现该执行命令的执行,而无需再重复输入触发关键词,增加用户体验感。进一步,还包括设定模块和命令存储模块,设定模块用于用户设置触发关键词和执行命令,然后将用户设定好的触发关键词和执行命令存储到命令存储模块内。用户根据自己说话习惯设置触发关键词和执行命令,便于用户记住触发关键词和执行命令,增加用户的体验感。另外,针对自由聊天场景下的语音识别系统,本申请还提供了一种自由聊天场景下的语音识别方法,包括如下步骤:S1、用户根据实际需求对触发关键词和执行命令进行编辑存储;S2、对用户说话过程中的语音信息进行采集;S3、判断采集到的语音信息中是否存在触发关键词,若含有触发关键词,则判断触发关键词后面输入的语音信息中是否含有执行命令,若该语音信息中含有执行命令,则将含有该触发关键词的语音段和含有该执行命令的语音段之间所有的语音信息组合成一个语音集;S4、根据组合的语音集判断该语音集中触发关键词和执行命令的实际占比值,若实际占比值大于等于预设占比值时按照执行命令进行动作执行。步骤S1中,用户根据实际需求对触发关键词和执行命令进行编辑和存储,用户可以根据自己的习惯来进行触发关键词和执行命令的编辑,增加客户体验感,步骤S2-S4中,通过判断触发关键词和执行命令在语音集中的实际占比值是否大于等于预设占比值来判断哪些执行命令应该进行相应的动作执行,能有效减小系统误执行命令的情况。进一步,在步骤S4中,在判断触发关键词和执行命令在语音集中的实际占比值时,根据判断该语音集中触发关键词和执行命令采集花费时长占该段语音集总共的采集时长的实际占比值。根据触发关键词的语音采集时长、执行命令的采集时长以及语音段总共的采集时长判断实际占比值大小,判断过程简单。进一步,在步骤S4中,若触发关键词和执行命令在语音集中的实际占比值小于预设占比值,则判断在预设时本文档来自技高网...

【技术保护点】
1.自由聊天场景下的语音识别系统,其特征在于,包括:命令判断模块和执行判断模块;命令判断模块用于判断采集到的用户语音信息中是否存在预设的触发关键词,若存在触发关键词,则判断触发关键词后面输入的语音信息中是否含有预设的执行命令,若该语音信息中含有执行命令,则将含有触发关键词的语音段和含有执行命令的语音段之间的所有语音信息组合成一个语音集发送给执行判断模块,执行判断模块接收到命令判断模块发送的语音集后判断该语音集中触发关键词和执行命令在该语音集中的实际占比值,当实际占比值大于等于预设占比值时执行命令。

【技术特征摘要】
1.自由聊天场景下的语音识别系统,其特征在于,包括:命令判断模块和执行判断模块;命令判断模块用于判断采集到的用户语音信息中是否存在预设的触发关键词,若存在触发关键词,则判断触发关键词后面输入的语音信息中是否含有预设的执行命令,若该语音信息中含有执行命令,则将含有触发关键词的语音段和含有执行命令的语音段之间的所有语音信息组合成一个语音集发送给执行判断模块,执行判断模块接收到命令判断模块发送的语音集后判断该语音集中触发关键词和执行命令在该语音集中的实际占比值,当实际占比值大于等于预设占比值时执行命令。2.根据权利要求1所述的自由聊天场景下的语音识别系统,其特征在于,还包括执行模块和距离检测模块,距离检测模块用于检测与用户之间的位置距离值,然后将位置距离值发送给执行模块;执行模块接收到距离检测模块发送的位置距离值时,判断该位置距离值是否属于预设距离值范围内,若该位置距离值属于预设距离值范围内,且执行判断模块判断触发关键词和执行命令在语音集中的占比大于等于预设占比值,则执行模块按照该执行命令执行相应的动作。3.根据权利要求2所述的自由聊天场景下的语音识别系统,其特征在于,还包括等待处理模块,当执行判断模块判断触发关键词和执行命令在语音集中的占比小于预设占比值时,将该执行命令发送给等待处理模块,等待处理模块接收到执行判断模块发送的执行命令后对该执行命令进行存储,当该命令指令存储后又在预设时间范围内执行判断模块发送了同样的执行命令给执行模块,则将存储的执行命令清零;当该命令存储后在预设时间范围内执行判断模块又发送了同样的执行命令给...

【专利技术属性】
技术研发人员:潘晓明
申请(专利权)人:重庆柚瓣家科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1