语音交互的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:26973614 阅读:27 留言:0更新日期:2021-01-06 00:07
本发明专利技术提供一种语音交互的方法、装置、设备和计算机存储介质,所述方法包括:智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;结束所述录音,执行与所述指令相对应的操作。本发明专利技术能够缩短语音交互所需的时间,提升语音交互的效率。

【技术实现步骤摘要】
语音交互的方法、装置、设备和计算机存储介质
本专利技术涉及互联网
,尤其涉及一种语音交互的方法、装置、设备和计算机存储介质。
技术介绍
在现有技术中,智能设备在进行语音交互时,需要首先获取用户所输入的语音内容,进而对所获取的语音内容进行识别后再执行相应的操作。但现有的智能设备通常采用预先设置固定的录音时间的方式,来获取用户所输入的语音内容。因此,现有技术存在以下缺点:即使用户在录音结束前完成了语音输入,但智能设备仍然会保持录音状态,直至录音时间结束,从而导致用户与智能设备之间语音交互的耗时较长,语音交互的效率较低。
技术实现思路
有鉴于此,本专利技术提供了一种语音交互的方法、装置、设备和计算机存储介质,用于缩短语音交互的时间,提升语音交互的效率。本专利技术为解决技术所采用的技术方案是提供一种语音交互的方法,所述方法包括:智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;结束所述录音,执行与所述指令相对应的操作。根据本专利技术一优选实施例,所述获取用户所输入的语音内容及其对应的文本识别结果包括:确定用户语音输入的结束时间;获取录音的开启时间与所述结束时间之间的语音内容作为所述用户所输入的语音内容;对所述语音内容进行文本转换,得到所述文本识别结果。根据本专利技术一优选实施例,所述将所述文本识别结果在命令词列表中进行匹配包括:计算所述文本识别结果与命令词列表中各命令词之间的语义相似度;将语义相似度满足预设匹配条件的命令词作为与所述文本识别结果相匹配的命令词。根据本专利技术一优选实施例,所述方法还包括:若无法获取与所述文本识别结果相匹配的命令词,则按照常规的语音交互过程,在录音结束之后,根据用户所输入的语音内容获取相应的指令。根据本专利技术一优选实施例,所述命令词列表为预设命令词列表以及动态命令词列表中的至少一个。根据本专利技术一优选实施例,所述预设命令词列表通过以下方式预先建立:记录用户各次输入的语音内容所对应的文本;确定满足预设频次条件的各文本作为命令词,并根据所确定的命令词建立预设命令词列表。根据本专利技术一优选实施例,所述动态命令词列表通过以下方式实时建立:确定当前页面中的各可点击选项;根据所述各可点击选项对应的文本确定命令词;根据所确定的命令词建立对应当前页面的动态命令词列表。本专利技术为解决技术问题所采用的技术方案是提供一种语音交互的装置,所述装置包括:获取单元,用于智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;匹配单元,用于将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;处理单元,用于结束所述录音,执行与所述指令相对应的操作。根据本专利技术一优选实施例,所述获取单元在获取用户所输入的语音内容及其对应的文本识别结果时,具体执行:确定用户语音输入的结束时间;获取录音的开启时间与所述结束时间之间的语音内容作为所述用户所输入的语音内容;对所述语音内容进行文本转换,得到所述文本识别结果。根据本专利技术一优选实施例,所述匹配单元将所述文本识别结果在命令词列表中进行匹配时,具体执行:计算所述文本识别结果与命令词列表中各命令词之间的语义相似度;将语义相似度满足预设匹配条件的命令词作为与所述文本识别结果相匹配的命令词。根据本专利技术一优选实施例,所述匹配单元还执行:若无法获取与所述文本识别结果相匹配的命令词,则按照常规的语音交互过程,在录音结束之后,根据用户所输入的语音内容获取相应的指令。根据本专利技术一优选实施例,所述命令词列表为预设命令词列表以及动态命令词列表中的至少一个。根据本专利技术一优选实施例,所述装置还包括建立单元,用于通过以下方式预先建立所述预设命令词列表:记录用户各次输入的语音内容所对应的文本;确定满足预设频次条件的各文本作为命令词,并根据所确定的命令词建立预设命令词列表。根据本专利技术一优选实施例,所述匹配单元还用于通过以下方式实时建立所述动态命令词列表:确定当前页面中的各可点击选项;根据所述各可点击选项对应的文本确定命令词;根据所确定的命令词建立对应当前页面的动态命令词列表。由以上技术方案可以看出,本专利技术通过在智能设备进行语音交互而开启录音之后,若所获取的与用户输入的语音内容所对应的文本识别结果能够与命令词列表中的命令词成功匹配,则在获取与该命令词相对应的指令之后,直接结束录音而执行相应的操作,从而避免了智能设备只有在固定的录音时间结束之后才能够响应指令的问题,从而缩短了语音交互所需的时间,提升了语音交互的效率。【附图说明】图1为本专利技术一实施例提供的一种语音交互的方法流程图;图2为本专利技术一实施例提供的智能电视中某一电视剧的影视详情页面的示意图;图3为本专利技术一实施例提供的一种语音交互的装置结构图;图4为本专利技术一实施例提供的计算机系统/服务器的框图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。图1为本专利技术一实施例提供的一种语音交互的方法流程图,如图1中所示,所述方法包括:在101中,智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果。在本步骤中,在智能设备与用户进行语音交互时开启录音,在获取用户所输入的语音内容之后,再获取该语音内容所对应的文本识别结果。其中,本专利技术中的智能设备为具有与用户进行语音交互能力的设备,例如智能手机、智能家电、智能汽车、智能穿戴设备等。具体地,本步骤在获取用户所输入的语音内容及其对应的文本识别结果时,可以采用以下方式:确定用户语音输入的结束时间,例如可以采用VAD(VoiceActivityDetection,语音活性检测)技术来检测用户是否结束语音输入;获取录音的开启时间与所确定的结束时间之间的语音内容作为用户输入的语音内容;对所获取的语音内容进行文本转换,得到文本识别结果。在102中,将所述文本识别结果在命令词列表中进行匹配后,获本文档来自技高网...

【技术保护点】
1.一种语音交互的方法,其特征在于,所述方法包括:/n智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;/n将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;/n结束所述录音,执行与所述指令相对应的操作。/n

【技术特征摘要】
1.一种语音交互的方法,其特征在于,所述方法包括:
智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;
将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;
结束所述录音,执行与所述指令相对应的操作。


2.根据权利要求1所述的方法,其特征在于,所述获取用户所输入的语音内容及其对应的文本识别结果包括:
确定用户语音输入的结束时间;
获取录音的开启时间与所述结束时间之间的语音内容作为所述用户所输入的语音内容;
对所述语音内容进行文本转换,得到所述文本识别结果。


3.根据权利要求1所述的方法,其特征在于,所述将所述文本识别结果在命令词列表中进行匹配包括:
计算所述文本识别结果与命令词列表中各命令词之间的语义相似度;
将语义相似度满足预设匹配条件的命令词作为与所述文本识别结果相匹配的命令词。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若无法获取与所述文本识别结果相匹配的命令词,则按照常规的语音交互过程,在录音结束之后,根据用户所输入的语音内容获取相应的指令。


5.根据权利要求1所述的方法,其特征在于,所述命令词列表为预设命令词列表以及动态命令词列表中的至少一个。


6.根据权利要求5所述的方法,其特征在于,所述预设命令词列表通过以下方式预先建立:
记录用户各次输入的语音内容所对应的文本;
确定满足预设频次条件的各文本作为命令词,并根据所确定的命令词建立预设命令词列表。


7.根据权利要求5所述的方法,其特征在于,所述动态命令词列表通过以下方式实时建立:
确定当前页面中的各可点击选项;
根据所述各可点击选项对应的文本确定命令词;
根据所确定的命令词建立对应当前页面的动态命令词列表。


8.一种语音交互的装置,其特征在于,所述装置包括:
获取单元,用于智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;
匹配单元,用于将所述文本识别结果在命令词列表中进行匹配后,获取与所匹...

【专利技术属性】
技术研发人员:范冰冰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1