基于语音识别的唤醒实现方法及装置制造方法及图纸

技术编号:30826889 阅读:12 留言:0更新日期:2021-11-18 12:27
本发明专利技术涉及一种基于语音识别的唤醒实现方法及装置,所述方法包括获取语音数据并对所述语音数据进行特征提取和前向计算;将计算后的语音数据输入到预构建的唤醒模型中,得到所述唤醒模型中唤醒词备选项的置信度;将所述置信度与预设阈值进行对比,根据对比结果判断是否输出唤醒结果。本发明专利技术通过语音数据,将备选列表中的内容尽可能多地列入考虑之中,本申请提供的技术方案是通过唤醒实现,因此有效屏蔽了用户的无效输入;将于备选列表的内容尽可能多地列入考虑之中,而不局限于特定词,还能够增加考虑用户说的内容,使得在筛选时更加精确。确。确。

【技术实现步骤摘要】
基于语音识别的唤醒实现方法及装置


[0001]本专利技术属于人工智能
,具体涉及一种基于语音识别的唤醒实现方 法及装置。

技术介绍

[0002]目前,语音识别愈加广泛地应用于车载系统中。在车载系统中,语音识别 最常用的场景是导航、打电话和听音乐。这三种场景都不可避免地存在列表筛 选。在列表筛选流程中,传统的方式是通过“第一个”、“第二个”等特定词语来 进行筛选。这样的筛选词较为固定,因此较容易实现,但也限制了用户的筛选 方式。因此,更好的方式是在固定词语之外,允许用户通过列表中的内容进行 数据筛选。通过列表内容筛选数据既可以使用语音唤醒实现,也可以用语音识 别实现。但是在通过语音识别进行筛选时,由于语音的候选空间较大,因此很 难保证当前流程不会被不相干的内容打断。且通过语音唤醒的方式实现时,由 于列表的内容千变万化,且长短不一,因此常规的语音唤醒技术无法直接应用。
[0003]相关技术中,市面上大部分语音产品在列表选择场景下通过列表内容筛选 数据并不理想,主要由于大家对列表数据通用的处理方式只是做了简单的分词, 之后再对词表做个性化加载。按照这种处理方式,用户能说的内容局限在某些 常见的特定词,如果提取出的词语区分度不足或者有缺失,用户就无法准确通 过列表内容筛选结果。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种基于语音识 别的唤醒实现方法及装置,以解决现有技术中用户无法准确通过列表内容筛选 结果的问题。
[0005]为实现以上目的,本专利技术采用如下技术方案:一种基于语音识别的唤醒实 现方法,包括:
[0006]获取语音数据并对所述语音数据进行特征提取和前向计算;
[0007]将计算后的语音数据输入到预构建的唤醒模型中,得到所述唤醒模型中唤 醒词备选项的置信度;
[0008]将所述置信度与预设阈值进行对比,根据对比结果判断是否输出唤醒结果。
[0009]进一步的,还包括:构建唤醒模型;所述构建唤醒模型,包括:
[0010]获取场景对话,根据所述场景对话获取当前场景下的列表数据;
[0011]对所述列表数据进行分析并根据分析结果将所述列表数据转换为唤醒词, 根据所述唤醒词构建唤醒词备选项;
[0012]将所述唤醒词备选项加入生效的唤醒词列表中,生成唤醒模型。
[0013]进一步的,所述唤醒模型等待唤醒结果时,如果判断输出唤醒结果或计算 超时无法输出唤醒结果则清除新增的唤醒词。
[0014]进一步的,对所述列表数据进行分析之前,还包括:
[0015]判断所述列表数据中是否存在有效数据;
[0016]如果存在则对所述列表数据进行预处理,否则,结束流程。
[0017]进一步的,所述对所述列表数据进行预处理,包括:
[0018]将获取的场景对话转换为文字;
[0019]对所述文字进行特殊符号和/或数字转换处理。
[0020]进一步的,所述对所述列表数据进行分析并根据分析结果将所述列表数据 转换为唤醒词,包括:
[0021]对所述列表数据中的每条数据进行分词和标音;
[0022]根据每条数据得到的分词结果和标音结果的词头构建多个唤醒词。
[0023]进一步的,根据词典对所述列表数据中的每条数据进行分词。
[0024]进一步的,所述将所述置信度与预设阈值进行对比,根据对比结果判断是 否输出唤醒结果,包括:
[0025]将所述置信度与预设阈值进行对比;
[0026]如果所述置信度大于等于预设阈值,则输出该置信度对应的唤醒词备选项; 否则,继续获取语音数据.
[0027]本申请实施例提供一种基于语音识别的唤醒实现装置,包括:
[0028]获取模块,用于获取语音数据并对所述语音数据进行特征提取和前向计算;
[0029]计算模块,用于将计算后的语音数据输入到预构建的唤醒模型中,得到所 述唤醒模型中唤醒词备选项的置信度;
[0030]输出模块,用于将所述置信度与预设阈值进行对比,根据对比结果判断是 否输出唤醒结果。
[0031]进一步的,还包括:构建模块,用于构建唤醒模型;所述构建唤醒模型, 包括:
[0032]获取场景对话,根据所述场景对话获取当前场景下的列表数据;
[0033]对所述列表数据进行分析并根据分析结果将所述列表数据转换为唤醒词, 根据所述唤醒词构建唤醒词备选项;
[0034]将所述唤醒词备选项加入生效的唤醒词列表中,生成唤醒模型。
[0035]本专利技术采用以上技术方案,能够达到的有益效果包括:
[0036]本专利技术提供一种基于语音识别的唤醒实现方法及装置,所述方法包括获取 语音数据并对所述语音数据进行特征提取和前向计算;将计算后的语音数据输 入到预构建的唤醒模型中,得到所述唤醒模型中唤醒词备选项的置信度;将所 述置信度与预设阈值进行对比,根据对比结果判断是否输出唤醒结果。本专利技术 通过语音数据,将备选列表中的内容尽可能多地列入考虑之中,本申请提供的 技术方案是通过唤醒实现,因此有效屏蔽了用户的无效输入;将于备选列表的 内容尽可能多地列入考虑之中,而不局限于特定词,还能够增加考虑用户说的 内容,使得在筛选时更加精确。
附图说明
[0037]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本专利技术基于语音识别的唤醒实现方法的步骤示意图;
[0039]图2为本专利技术基于语音识别的唤醒实现方法的流程示意图;
[0040]图3为本专利技术基于语音识别的唤醒实现装置的结构示意图;
[0041]图4为本专利技术基于语音识别的唤醒实现方法的涉及的硬件运行环境的计算 机设备的结构示意图。
具体实施方式
[0042]为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方 案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不 是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创 造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。
[0043]下面结合附图介绍本申请实施例中提供的一个具体的基于语音识别的唤醒 实现方法及装置。
[0044]如图1所示,本申请实施例中提供的基于语音识别的唤醒实现方法,包括:
[0045]S101,获取语音数据并对所述语音数据进行特征提取和前向计算;
[0046]本申请实时获取用户发出的语音,例如用户可以说“导航到XXX(其中, XXX表示为某个地名)”,从而得到语音数据。然后对语音数据进行特征提取和 前向计算。
[0047]其中,特征提取是提取语音数据中的声学特征,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的唤醒实现方法,其特征在于,包括:获取语音数据并对所述语音数据进行特征提取和前向计算;将计算后的语音数据输入到预构建的唤醒模型中,得到所述唤醒模型中唤醒词备选项的置信度;将所述置信度与预设阈值进行对比,根据对比结果判断是否输出唤醒结果。2.根据权利要求1所述的方法,其特征在于,还包括:构建唤醒模型;所述构建唤醒模型,包括:获取场景对话,根据所述场景对话获取当前场景下的列表数据;对所述列表数据进行分析并根据分析结果将所述列表数据转换为唤醒词,根据所述唤醒词构建唤醒词备选项;将所述唤醒词备选项加入生效的唤醒词列表中,生成唤醒模型。3.根据权利要求2所述的方法,其特征在于,所述唤醒模型等待唤醒结果时,如果判断输出唤醒结果或计算超时无法输出唤醒结果则清除新增的唤醒词。4.根据权利要求2所述的方法,其特征在于,对所述列表数据进行分析之前,还包括:判断所述列表数据中是否存在有效数据;如果存在则对所述列表数据进行预处理,否则,结束流程。5.根据权利要求4所述的方法,其特征在于,所述对所述列表数据进行预处理,包括:将获取的场景对话转换为文字;对所述文字进行特殊符号和/或数字转换处理。6.根据权利要求2所述的方法,其特征在于,所述对所述列表数据进行分析并根据分析结果将所述...

【专利技术属性】
技术研发人员:赵茂祥李全忠何国涛蒲瑶
申请(专利权)人:普强时代珠海横琴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1