一种语音交互方法及装置制造方法及图纸

技术编号:21345765 阅读:30 留言:0更新日期:2019-06-13 23:18
本发明专利技术涉及语音识别技术领域,公开了一种语音交互方法及装置,该方法包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制;通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。

【技术实现步骤摘要】
一种语音交互方法及装置
本专利技术涉及语音识别
,尤其涉及一种语音交互方法及装置。
技术介绍
目前由于深度学习技术的发展,使得语音识别结果的准确度越来越高,类似智能音箱的各种产品受到市场的广泛关注,智能音箱等产品采集用户语音上传至云端服务器,利用服务器的资源进行快速解码,获得语音识别结果。在嵌入式平台上,受限于处理器性能、内存资源的影响,本地离线大词汇量连续语音识别难以实现;在有限命令词的情况下,人机命令词交互性体验差。
技术实现思路
本专利技术的主要目的在于提出一种语音交互方法及装置,通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。为实现上述目的,本专利技术提供的一种语音交互方法,包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制。可选地,所述通过解码器解码音频信号,获得解码结果生成图之前还包括:对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。可选地,所述根据所述置信度对对应的解码结果词进行过滤包括:根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;否则,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。可选地,所述对过滤后的解码结果词进行组词,并通过组词结果进行控制包括:根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;否则,所述组词结果为唤醒词,进行唤醒操作。可选地,所述进行快捷控制之前还包括:对所述组词结果进行动名词互换操作。作为本专利技术的另一方面,提供的一种语音交互装置,包括:解码模块,用于通过解码器解码音频信号,获得解码结果生成图;置信度获取模块,用于从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;过滤模块,用于根据所述置信度对对应的解码结果词进行过滤;组词控制模块,用于对过滤后的解码结果词进行组词,并通过组词结果进行控制。可选地,还包括:初始化模块,用于对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。可选地,所述过滤模块包括:命令判断单元,用于根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;阈值判断单元,用于当所述解码结果词为命令词时,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。可选地,所述组词控制模块包括:组词单元,用于根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;控制单元,用于判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;唤醒单元,用于当所述组词结果为唤醒词时,进行唤醒操作。可选地,所述组词控制模块还包括:互换单元,用于对所述组词结果进行动名词互换操作。本专利技术提出的一种语音交互方法及装置,该方法包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制;通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。附图说明图1为本专利技术实施例一提供的一种语音交互方法的流程图;图2为本专利技术实施例一提供的另一种语音交互方法的流程图;图3为图1中步骤S30的方法流程图;图4为本专利技术实施例二提供的一种语音交互装置的示范性结构框图;图5为本专利技术实施例二提供的另一种语音交互装置的示范性结构框图;图6为图4中过滤模块的示范性结构框图;图7为图4中组词控制模块的一种示范性结构框图;图8为图4中组词控制模块的另一种示范性结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。实施例一如图1所示,在本实施例中,一种语音交互方法,包括:S10、通过解码器解码音频信号,获得解码结果生成图;S20、从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;S30、根据所述置信度对对应的解码结果词进行过滤;S40、对过滤后的解码结果词进行组词,并通过组词结果进行控制。在本实施例中,通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。在本实施例中,在解码前还需要对语音识别模型进行训练,对发音字典中的命令词进行拆分并添加部分填充词,训练得到分词的模型,其中,填充词为非命令词,用于降低误识别率,提升交互的准确性。如图2所示,在本实施例中,所述步骤S10之前还包括:S01、对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。在本实施例中,应用场景为空调、微波炉、灯、网关等,不同应用场景拥有不同的控制命令词。场景选定后,其他场景的命令词被当作填充词看待。在本实施例中,场景词id重映射表:因模型训练时,加入一些填充词,会导致每次训练后词的id发生变化,例如某次训练词“打开”在模型中的id是m,另外一次训练词“打开”会变成另外一个整数n;为了消除每次训练生成的模型中词的id不固定问题,需要重新映射到一个新的固定的id上。在本实施例中,词与词的关联关系表:利用以上重新映射的id值,配置词与词的关联关系表,此表包含五个属性,分别为命令词映射后的id、词类型、自定义置信度阈值、关联关系、特殊关联关系,具体的说明如下:词类型:用于区分命令词的类型。类型1代表未拆分的命令词,如“打开空调”;类型2代表有关联关系的拆分词,如“打开”、“关闭”;类型3代表一种特殊词,它本身是一个命令词或者可以组成命令词,但在解码序列中检出它之后,并不一定是解码结果,如“电加热关闭”,“电加热”本身是一个命令词,但是还需要检查后续是否存在动词“关闭”,否则会执行相反的控制操作;自定义置信度阈值:用于调整每个拆分后的命令词的置信度阈值,使得整个系统的打分机制更加灵活,在一定程度上可以控制误识别率;关联关系:用于存放与当前词有关联的词的id,比如当前词为“打开”,与之相关联的词有“灯”、“台灯”“书房灯”等等;特殊关联关系:若词类型为3,当前词是拆分词,首先该词需要与关联关系表中的词进行组合,组合后的词属于命令词,此时在解码序列中检出它之后,并不一定是解码结果,例如“睡眠模式关闭”,当前词为“睡眠”,关联关系词为“模式”,如果组合成“睡眠模式”,会执行错误的控制操作,所以还需要检查后续解码序列中是否存在特殊关联关系词“关闭”。在本实施例中,输出结果表:包括命令词,播放的语音路径及控本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制。

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制。2.根据权利要求1所述的一种语音交互方法,其特征在于,所述通过解码器解码音频信号,获得解码结果生成图之前还包括:对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。3.根据权利要求2所述的一种语音交互方法,其特征在于,根据所述置信度对对应的解码结果词进行过滤包括:根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;否则,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。4.根据权利要求3所述的一种语音交互方法,其特征在于,所述对过滤后的解码结果词进行组词,并通过组词结果进行控制包括:根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;否则,所述组词结果为唤醒词,进行唤醒操作。5.根据权利要求4所述的一种语音交互方法,其特征在于,所述进行快捷控制之前还包括:对所述组词结果进行动名词互换操作。6.一种语音交互装置,其特征在于,包...

【专利技术属性】
技术研发人员:陈江曾敏张少峰谢世波
申请(专利权)人:深圳市伟文无线通讯技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1