一种语音识别输入的控制方法及系统技术方案

技术编号:13175304 阅读:34 留言:0更新日期:2016-05-10 18:40
本发明专利技术涉及计算机语音识别领域,特别是一种语音识别输入的控制方法及系统。现有语音识别输入控制存在以下缺陷:语音识别准确度单一,只有默认固定命令模板,不能满足用户多样性需求;命令内容固定死板,用同义词发出命令时,无法识别,导致语音识别输入失败。本发明专利技术提供了一种语音识别输入的控制方法及对应控制系统,将语音输入转成的文本信息用同义词进行替换,得到带有标准命令词语的文本信息后换分为关键词数组,然后对其中的潜在命令用同义词进行替换,再进行命令匹配,转换得到完整的标准命令,发送给终端设备,控制设备完成相应动作,所述语音识别输入的控制方法能够对用户的语音输入进行正确识别,且识别准确度高。

【技术实现步骤摘要】

本专利技术涉及智能设备语音输入控制领域,特别是一种语音识别输入的控制方法及系统,所述控制方法和系统用于实现移动终端设备控制家电运行工作。
技术介绍
现有智能家居设备输入控制多采用触摸界面,使用中要多次点击触摸屏,逐层进入菜单,完成输入控制操作如开空调、设定温度等,当家中智能设备过多时用户先要找到对应设备再做后续操作。现有家电生产商通过手机进行语音输入,经语音识别后输入控制家电,替代现有家电常规的触屏操作,以此简化操作、提高使用上便利性,所述语音识别是一种输入语音进行识别,然后转成文字的计算机技术,通过语音识别能够实现语音输入控制各种智能家电设备,该技术在越来越多的智能家居设备上得到应用,用户必须按照指定命令进行相同的语音输入,当语音输入和指定命令不一致如命令前后或者中间夹杂一些非命令语音时,就会导致识别失败。现有语音识别输入控制存在以下缺陷:1、语音识别准确度单一,只提供默认的固定命令模板,不能满足用户多样性需求;2、命令内容固定死板,当用户使用与指定命令含义相同的同义词发出命令时,无法准确识别,语音识别输入不起作用。
技术实现思路
本专利技术要解决的技术问题和提出的技术任务是提供一种语音识别输入的控制方法及对应控制系统,所述语音输入能够对用户的语音输入进行正确识别,且识别准确度高。本专利技术采用如下的技术方案:一种语音识别输入的控制方法,包括依序进行的以下步骤: (1)语音输入,通过手机端输入采集语音; (2)语音转换文字,将语音信息转换成文本信息;所述转换可以在服务器或手机上进行,并且这种转换属于现有技术(不影响专利),可以通过市场上已有的专业语言服务供应商服务获取; (3)提取关键词,将文本信息的内容划分为关键词数组(可以选择在服务器或手机上进行); (4)同义词替换,将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语(可以选择在服务器或手机上进行);由于现在识别的命令都有固定的格式,且识别数量有限,因此该过程可以通过在服务器上预存很多与标准命令词语匹配的同义词,然后通过运算进行筛选,选出匹配的,再将潜在命令词语替换成同义的标准命令词语;把用户口语化的词汇替换为标准普通话词汇,比如方言“打开来”替换为机器能识别的普通话“开启”,方言话“连起来”替换为机器能识别的普通话“接通,”普通话“运转起来”替换为机器能识别的普通话“开启”。(5)命令匹配,对带有标准命令词语的文本信息进行匹配得到完整的标准命令; (6)命令发送,将标准命令通过网络发送到终端设备,控制设备完成相应动作。本专利技术将语音输入转成的文本信息用同义词进行替换,得到带有标准命令词语的文本信息后换分为关键词数组,然后对其中的潜在命令用同义词进行替换,再进行命令匹配,转换得到完整的标准命令,通过网络发送给终端设备,控制设备完成相应动作,所述语音识别输入的控制方法能够对用户的语音输入进行正确识别,且识别准确度高。作为对上述技术方案的进一步完善和补充,本专利技术采用如下技术措施:所述的步骤(5)命令匹配为一种计算机算法,所述的步骤(5)命令匹配为一种计算机算法,所述预设命令为含有两个以上选项的多元组,匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部选项的匹配。进一步的,所述预设命令为三元组{操作,地点,设备}或四元组{操作,地点,设备,定时},匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部三个或四个选项的匹配。比如对于插座,用户输入的语音经过(1)-(4)步骤后,生成相应的命令为{打开,臣卜室,插座,现在},预设的默认命令集中,针对“打开”的操作就预设了一个默认命令集合,比如,第一项命令只要包含在命令集合(默认命令+自定义命令)中则匹配完成,否则即视为匹配失败;如果第一项命令匹配完成,则继续匹配第二项命令,依次类推;当预设命令为三元组时,即有三个选项要匹配,此时完成三个选项匹配后即时对设备进行相应操作,当预设命令为四元组,即有四个选项要匹配时才对设备相应操作,如对于第四项“定时”如果用户有定时,则按用户定时的时间对设备进行相应操作。实际执行中,比如标准命令为“打开卧室灯”,用户命令为“打开卧室的灯”,经过关键词提取后得到“打开”、“卧室”、“灯”,标准命令的格式为{打开,卧室,灯},如果能够匹配一个完整的命令,则往下执行。所述的预设命令包括默认命令和自定义命令,所述默认命令是一套预设定的规则文本,自定义命令是用户自行定义的一套可识别的规则文本,所述默认命令和自定义命令组成命令集合。默认命令可以套用固定命令模板,如空调和电视,都会由一个模版来进行命令识别。自定义命令则是根据用户不同习惯,与设备控制的动作相关联进行,具体是通过将用户的命令进行文本转换、关键词提取、去噪等动作,生成一种计算机可识别的命令格式,然后该自定义命令格式的识别过程和默认命令一致,详见本专利技术所述的控制方法中步骤1?6。如针对“打开”的操作已经预设了一个默认命令集合,比如,如果用户针对打开操作新增了自己的自定义指令,可以添加到该默认命令集合中去,比如针对“打开”的操作,用户新增了自定义的指令后,命令集合就可能变为。实践中,默认命令可以是存储在服务器上的一套预设定的规则文本,自定义命令是用户自行定义的一套服务器能够识别的规则文本,所述自定义命令可在手机端上生成然后发送到服务器。所述的命令匹配中,自定义命令优先于默认命令,即先和自定义命令进行匹配,然后再跟默认命令进行匹配。将自定义命令优于默认命令,可以更好满足客户的个性需求。—种语音识别输入的控制系统,包括依序相连的语音采集模块、语音转换模块、提取模块、同义词替换模块以及命令匹配模块和命令发送模块,其中语音采集模块用于采集语音信息;语音转换模块用于将语音信息转换成文本信息;提取模块用于将文本信息的内容划分为关键词数组;同义词替换模块将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;命令匹配模块可以把带有标准命令词语的文本信息与存储的预设命令进行匹配得到完整的标准命令;命令发送模块将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。其中语音采集模块设于手机上依赖现有手机进行,命令发送模块位于服务器上,其余模块可以根据需要设于手机或服务器上;所述预设命令即为默认命令,默认命令既可以放在服务器上,也可以随APP下载到手机端,自定义命令也一样,可以在手机端生成后保存在手机端,也可以上传到服务器端。所述的语音采集模块和命令匹配模块之间还连有一个命令生成模块,所述命令生成模块的输入端接语音采集模块,输出端接命令匹配模块。命令生成模块的作用是将采集的用户语音,根据用户不同的家电设备,套用现有命令模板,生成潜在的用户命令,并上传给命令匹配模块存储成为新增的自定义命令。潜在的用户命令是指用户输入的不规则、无语法可循的语音信息经过命令生成模块处理后生成规则的、含语法语义的语音命令信息。所述的语音采集模块和命令匹配模块之间还连有一个自动学习模块,所述自动学习模块的输入端接语音采集模块,输出端接命令匹配模块。自动学习模块的作用是将采集的语音信息解析本文档来自技高网...

【技术保护点】
一种语音识别输入的控制方法,包括依序进行的以下步骤:(1)语音输入,通过手机端输入采集语音;(2)语音转换文字,将语音信息转换成文本信息;(3)提取关键词,将文本信息的内容划分为关键词数组;(4)同义词替换,将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;(5)命令匹配,对带有标准命令词语的文本信息与预设命令进行匹配得到完整的标准命令;(6)命令发送,将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴超贺思思
申请(专利权)人:杭州智蚁科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1