语音处理方法及装置制造方法及图纸

技术编号:17915093 阅读:29 留言:0更新日期:2018-05-10 19:51
本发明专利技术涉及计算机技术领域,提供了一种语音处理方法及装置,该语音处理方法,包括:对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息;根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,所述检测结果中包含有语义匹配度最高的语义识别结果;基于包含该语义识别结果的检测结果进行对应的处理。实现了基于语音的处理,并且通过语音指令的控制,实现了无需人为操作即可实现对应操作的处理过程,降低了人为劳动力,同时实现了对于复杂语音指令有效处理,增加了处理范围,并通过这种免去人为操作过程的处理,进一步提升了用户的使用感受。

【技术实现步骤摘要】
语音处理方法及装置
本专利技术涉及计算机
,特别是涉及一种语音处理方法及装置。
技术介绍
随着消费类电子产品快速的发展,电子产品的功能性也越发强大。语音作为人类最基本的方式,将语音识别技术应用到消费类电子产品中,实现通过自然语音来控制此类产品的功能是未来发展的趋势。随着科技发展,尤其手机终端与多媒体终端设备的科技、智能化发展,人们在使用这些设备时,也不再仅仅是局限于其最初的基本功能,而是在追求越发智能化、人性化、便捷化、个性化的功能需求。如何能通过语音识别技术实现满足上述功能需求的技术方案,成为了当前亟待解决的技术问题。
技术实现思路
本专利技术提供语音处理方法及装置,以实现基于语音指令的对应处理,同时通过多场景的应用,增加了处理范围,并且有效提升用户的使用感受。本专利技术提供了一种语音处理方法,包括:对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息;根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,所述检测结果中包含有语义匹配度最高的语义识别结果;基于包含该语义识别结果的检测结果进行对应的处理。优选地,所述语音特征信息包括语义特征,所述根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,包括:根据预设的语义识别模块对所述语义特征进行识别,得到多个语义识别结果;并在得到的多个语义识别结果中确认语义匹配度最高的语义识别结果。优选地,所述基于包含该语义识别结果的检测结果进行对应的处理,包括:基于所述包含该语义识别结果的检测结果按照所述语音指令进行对应的处理;或,基于所述包含该语义识别结果的检测结果不做任何处理。优选地,所述基于所述包含该语义识别结果的检测结果按照所述语音指令进行对应的处理,包括:确定所述语音指令对应的指示信息;根据所述指示信息做相应的处理。优选地,所述指示信息包括如下任一项:基于网络直播平台和/或多媒体采集设备中的特定指令;基于多媒体设备中的播放和/或暂停指令。优选地,所述特定指令包括如下任一项:拍照;摄像;拍照中添加特效信息;摄像中添加特效信息。优选地,还包括:获取当前用户触发的动作和/或人脸;对当前用户触发的动作和/或人脸进行识别检测,得到识别结果;其中,所述基于包含该语义识别结果的检测结果进行对应的处理,包括:基于包含该语义识别结果的检测结果,并结合基于动作和/或人脸识别结果,进行对应的处理。优选地,还包括:根据预设的语音唤醒模块对所述语音特征信息进行检测,得到检测结果。优选地,所述根据预设的语音唤醒模块对所述语音特征信息进行检测,包括:根据所述语音唤醒模块对语音特征信息进行匹配,确定所述语音唤醒模块中是否存储有与语音特征信息匹配的目标语音特征信息;并在匹配成功时,得到该匹配的目标语音特征信息。优选地,在根据预设的语音唤醒模块对所述语音特征信息进行检测时,所述对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息,包括:对所述语音指令进行声学特征提取,得到该语音指令对应的梅尔频率倒谱系数MFCC特征信息。本专利技术还提供了一种语音处理装置,包括:解析单元,用于对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息;第一处理单元,用于根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,所述检测结果中包含有语义匹配度最高的语义识别结果;基于包含该语义识别结果的检测结果进行对应的处理。优选地,所述语音特征信息包括语义特征,所述第一处理单元,还用于根据预设的语义识别模块对所述语义特征进行识别,得到多个语义识别结果;并在得到的多个语义识别结果中确认语义匹配度最高的语义识别结果。优选地,所述第一处理单元,用于基于所述包含该语义识别结果的检测结果按照所述语音指令进行对应的处理;或,基于所述包含该语义识别结果的检测结果不做任何处理。优选地,所述第一处理单元,具体用于确定所述语音指令对应的指示信息;根据所述指示信息做相应的处理。优选地,所述指示信息包括如下任一项:基于网络直播平台和/或多媒体采集设备中的特定指令;基于多媒体设备中的播放和/或暂停指令。优选地,所述特定指令包括如下任一项:拍照;摄像;拍照中添加特效信息;摄像中添加特效信息。优选地,还包括:获取单元,用于获取当前用户触发的动作和/或人脸;第二处理单元,用于对当前用户触发的动作和/或人脸进行识别检测,得到识别结果;所述第一处理单元,还用于基于包含该语义识别结果的检测结果,并结合基于动作和/或人脸识别结果,进行对应的处理。优选地,所述第一处理单元,还用于根据预设的语音唤醒模块对所述语音特征信息进行检测,得到检测结果。优选地,所述第一处理单元,用于根据所述语音唤醒模块对所述语音特征信息进行匹配,确定所述语音唤醒模块中是否存储有与语音特征信息匹配的目标语音特征信息;并在匹配成功时,得到该匹配的目标语音特征信息。优选地,所述解析单元,具体用于对所述语音指令进行声学特征提取,得到该语音指令对应的梅尔频率倒谱系数MFCC特征信息。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的方法。本专利技术还提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的语音处理方法对应的操作。与现有技术相比,本专利技术至少具有以下优点:通过对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息的处理,实现了对所需求语音指令的特征提取,为后续对于该提取的特征的检测处理提供了保障;并且通过预设的语义识别模块对该提取出的语音特征信息中包含的语义特征的检测,再根据包含有语义匹配度最高的语义识别结果的检测结果来进行对应的处理,实现了基于语音指令的对应处理,实现了无需人为操作即可实现拍照的过程,降低了人为劳动力,同时实现了在复杂应用场景中对语音指令的有效处理,增加了处理范围;同时通过语音唤醒模块与语义识别模块的结合处理,提升了语音识别的准确度;也通过这种免去人为操作过程的处理,进一步提升了用户的使用感受。附图说明图1是本专利技术提供的语音处理方法的流程示意图;图2是本专利技术提供的语音处理装置的结构图。具体实施方式本专利技术提出一种语音处理方法及装置,下面结合附图,对本专利技术具体实施方式进行详细说明。下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线本文档来自技高网
...
语音处理方法及装置

【技术保护点】
一种语音处理方法,其特征在于,包括:对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息;根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,所述检测结果中包含有语义匹配度最高的语义识别结果;基于包含该语义识别结果的检测结果进行对应的处理。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:对获取到的语音指令进行解析,得到所述语音指令对应的语音特征信息;根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,所述检测结果中包含有语义匹配度最高的语义识别结果;基于包含该语义识别结果的检测结果进行对应的处理。2.如权利要求1所述的方法,其特征在于,所述语音特征信息包括语义特征,所述根据预设的语义识别模块对所述语音特征信息中包含的语义特征进行检测,得到检测结果,包括:根据预设的语义识别模块对所述语义特征进行识别,得到多个语义识别结果;并在得到的多个语义识别结果中确认语义匹配度最高的语义识别结果。3.如权利要求1或2所述的方法,其特征在于,所述基于包含该语义识别结果的检测结果进行对应的处理,包括:基于所述包含该语义识别结果的检测结果按照所述语音指令进行对应的处理;或,基于所述包含该语义识别结果的检测结果不做任何处理。4.如权利要求3所述的方法,其特征在于,所述基于所述包含该语义识别结果的检测结果按照所述语音指令进行对应的处理,包括:确定所述语音指令对应的指示信息;根据所述指示信息做相应的处理。5.如权利要求4所述的方法,其特征在于,所述指示信息包括如下任一项:基于网络直播平台和/或多媒体采集设备中的特定指令;基于多媒体设备中的播放和/或暂停指令...

【专利技术属性】
技术研发人员:毕宇鹏
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1