一种语音识别方法、装置和电子设备制造方法及图纸

技术编号:27840082 阅读:23 留言:0更新日期:2021-03-30 12:22
本申请公开了一种语音识别方法、装置及电子设备,属于语音识别技术领域。其中,所述方法包括:将接收的音频数据转化为第一文字段;在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词;对所述第一文字段中的目标分词进行处理生成目标文字段;其中,对所述目标分词的处理包括以下至少之一:删除所述目标分词、将所述目标分词所属单句替换为目标字符串。本申请实施例通过对第一文字段中预设类型的各第一分词进行删除或替换处理,能更好地明确用户的意图,快速完成改写,有效提升语音识别的执行效果。有效提升语音识别的执行效果。有效提升语音识别的执行效果。

【技术实现步骤摘要】
一种语音识别方法、装置和电子设备


[0001]本申请属于语音识别
,具体涉及一种语音识别方法、装置和电子设备。

技术介绍

[0002]当前,人机交互设备通过自动语音识别技术(Automatic Speech Recognition,ASR)分析理解用户指令,继而完成后续相应操作,极大地提升了人机交互的便利性。
[0003]但是,现有的自动语音识别技术在因周围噪音等出现收音异常时,容易因上屏话术包含大量冗余信息而扭曲用户的意图,进而导致相应地执行结果达不到用户的预期,影响了用户的使用体验。

技术实现思路

[0004]本申请实施例的目的是提供一种语音识别方法,能够解决现有的语音识别技术容易因收音异常导致用户的意图被扭曲,使得相应地执行结果达不到用户预期的问题。
[0005]为了解决上述技术问题,本申请是这样实现的:
[0006]第一方面,本申请实施例提供了一种语音识别方法,其中,所述方法包括:
[0007]将接收的音频数据转化为第一文字段;
[0008]在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词;其中,所述第一预设条件包括以下至少之一:文字总数大于预设字数阈值且包含预设核心词;文字总数大于预设字数阈值且预设话术库中存在与所述第一文字段相似度大于预设相似度阈值的第二文字段;
[0009]对所述第一文字段中的目标分词进行处理生成目标文字段;其中,对所述目标分词的处理包括以下至少之一:删除所述目标分词、将所述目标分词所属单句替换为目标字符串。
[0010]第二方面,本申请实施例提供了一种语音识别装置,其中,该装置包括:
[0011]转换模块,用于将接收的音频数据转化为第一文字段;
[0012]检测模块,用于在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词;其中,所述第一预设条件包括以下至少之一:文字总数大于预设字数阈值且包含预设核心词;文字总数大于预设字数阈值且预设话术库中存在与所述第一文字段相似度大于预设相似度阈值的第二文字段;
[0013]处理模块,用于对所述第一文字段中的目标分词进行处理生成目标文字段;其中,对所述目标分词的处理包括以下至少之一:删除所述目标分词、将所述目标分词所属单句替换为目标字符串。
[0014]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0015]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程
序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0016]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0017]在本申请实施例中,在进行语音识别时,先将接收的音频数据转化为第一文字段;然后在第一文字段满足判定为异常话术的第一预设条件的情况下,检测第一文字段中预设类型的各第一分词;再对第一文字段中的目标分词进行处理生成目标文字段。通过在接收的音频数据转化的第一文字段满足第一预设条件的情况下,即第一文字段判定为异常话术的情况下,对第一文字段中预设类型的各第一分词进行删除或替换处理,能更好地明确用户的意图,快速完成改写,有效提升语音识别的执行效果。
附图说明
[0018]图1是本申请实施例提供的语音识别方法的步骤流程图;
[0019]图2是本申请实施例中第一文字段的显示效果示意图;
[0020]图3是本申请实施例中对冗余词的裁剪操作示意图;
[0021]图4是本申请实施例中对冗余词进行裁剪操作后的效果示意图;
[0022]图5是本申请实施例中第一字符串推荐列表的显示效果示意;
[0023]图6是本申请实施例中对第一目标字符串进行点击后的显示效果示意;
[0024]图7是本申请实施例中第一字符串推荐列表的显示效果示意;
[0025]图8是本申请实施例中对第二目标字符串进行点击后的显示效果示意;
[0026]图9是本申请实施例所提供的语音识别方法的一种执行流程图;
[0027]图10是本申请实施例所提供的冗余词判断过程示意图;
[0028]图11是本申请实施例所提供的语音识别方法的另一种执行流程图;
[0029]图12是本申请实施例所提供的第二字符串推荐列表的生成过程示意图;
[0030]图13是本申请实施例提供的语音识别装置的结构示意图;
[0031]图14是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0033]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0034]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文档显示方法进行详细地说明。
[0035]请参阅图1,示出了本申请实施例提供的一种语音识别方法的步骤流程图,其中,该方法可以包括步骤S100~S300。
[0036]本申请实施例中,上述语音识别方法应用于具有语音接收功能及文字显示功能的终端设备,具体可以是手机、平板电脑、电视机、车载电子设备、可穿戴设备、语音助手、有屏音响等人机交互设备。
[0037]步骤S100、将接收的音频数据转化为第一文字段。
[0038]上述步骤S100中,利用语音识别技术,对接收的音频数据进行识别,转化为对应的文字段,即上述第一文字段,以便于后续显示及进行语义分析、分词处理等。
[0039]其中,因为接收的音频数据不仅包含了用户语义,还可能包含的外界周围噪音,因而ABS服务在识别音频数据时会同时识别用户语音及外界噪音,使得第一文字段包含了用户语音及外界噪音对应的文字。例如,用户原始语音为“天气咋样”,但因为外界噪音的干扰,使得得到第一文字段可能为“走哈哈啊别忘了啊呀闹钟,你你你天气咋样”。
[0040]步骤S200、在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词;其中,所述第一预设条件包括以下至少之一:文字总数大于预设字数阈值且本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:将接收的音频数据转化为第一文字段;在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词;其中,所述第一预设条件包括以下至少之一:文字总数大于预设字数阈值且包含预设核心词;文字总数大于预设字数阈值且预设话术库中存在与所述第一文字段相似度大于预设相似度阈值的第二文字段;对所述第一文字段中的目标分词进行处理生成目标文字段;其中,对所述目标分词的处理包括以下至少之一:删除所述目标分词、将所述目标分词所属单句替换为目标字符串。2.根据权利要求1所述的语音识别方法,其特征在于,在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中预设类型的各第一分词的步骤,包括:在所述第一文字段满足第一预设条件的情况下,检测所述第一文字段中的冗余词、主语、谓语、宾语及预设核心词;其中,所述冗余词为第一文字段中与前后预设位数的分词的组合不符合预设语言表达方式,且不存在于预设热词库中的分词。3.根据权利要求2所述的语音识别方法,其特征在于,在所述目标分词为冗余词的情况下,所述对所述第一文字段中的目标分词进行处理生成目标文字段的步骤,包括:将所述目标分词从所述第一文字段中删除,生成目标文字段。4.根据权利要求2所述的语音识别方法,其特征在于,在所述目标分词为预设核心词的情况下,所述对所述第一文字段中的目标分词进行处理生成目标文字段的步骤,包括:接收对所述各第一分词中目标分词的第一输入;响应于所述第一输入,生成与所述目标分词匹配的第一字符串推荐列表;接收对所述第一字符串推荐列表中第一目标字符串的第二输入;响应于所述第二输入,将所述第一文字段中所述目标分词所在单句替换为所述第一目标字符串,生成目标文字段。5.根据权利要求1所述的语音识别方法,其特征在于,在所述第一文字段中包括主语、谓语、宾语及预设核心词的情况下,所述对所述第一文字段中的目标分词进行处理生成目标文字段的步骤,包括:根据所述第一文字段中的主语、谓语、宾语、预设核心词及用户的使用日志,生成第二字符串推荐列表;接收对所述第二字符串推荐列表中第二目标字符串的第三输入;将所述第二目标字符串确定为目标文字段。6.一种语音识别装置,其特征在于,所述装置包括:转换模块,用于将接收的音频数据转化为第一文字段;检测模块...

【专利技术属性】
技术研发人员:李倩倩
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1