一种音频处理方法及装置制造方法及图纸

技术编号:19483261 阅读:21 留言:0更新日期:2018-11-17 10:57
本申请提供的音频处理方法及装置,在获得第一音频输入并获得第一音频输入对应的第一文本信息后,获得通过编辑所述第一文本信息中的第一子文本信息得到的第二子文本信息,该第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。由于能够利用通过编辑所述第一文本信息中的第一子文本信息得到的第二子文本信息,对所述第一关系集合进行更新,从而可使得第一关系集合中输入信息和文本信息的匹配信息更为精准,后续,在基于更新后的第一关系集合进行信息匹配处理时,可进一步提升信息匹配的准确率。

【技术实现步骤摘要】
一种音频处理方法及装置
本申请属于音频处理
,尤其涉及一种音频处理方法及装置。
技术介绍
现有的语音识别引擎,在将用户语音识别为文字信息时,识别的准确率不够高,以市面上的语音识别引擎为例,其识别准确率一般在90%左右,即约存在10%的错误识别概率,从而,影响了用户的语音输入体验。
技术实现思路
本申请公开如下技术方案:一种音频处理方法,包括:获得第一音频输入;获得所述第一音频输入对应的第一文本信息;获得第二子文本信息,所述第二子文本信息是通过编辑所述第一文本信息中的第一子文本信息得到的;其中,所述第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。上述方法,优选的,其中,所述输入信息和文本信息的对应关系包括下列对应关系中的至少一种:音频输入信息和文本信息的对应关系;或者,文本输入信息和文本信息的对应关系;其中,所述更新第一关系集合包括下列中的至少一种:依据第一子文本信息确定在所述第一音频输入中对应的第一子音频数据,将所述第一子音频数据作为第一音频输入信息;依据所述第一音频输入信息和第二子文本信息形成的对应关系更新所述第一关系集合;或者,依据第二子文本信息确定第二子文本信息对应的字符信息,所述字符信息是能输入形成所述第二子文本信息的信息,将所述字符信息作为第一文本输入信息;依据所述第一文本输入信息和第二子文本信息形成的对应关系更新所述第一关系集合。上述方法,优选的,如果所述第一关系集合包括音频输入信息和文本信息的对应关系,所述第一关系集合还能够基于第二关系集合的更新而更新;所述第二关系集合包括文本输入信息和文本信息的对应关系;其中,第一关系集合基于第二关系集合的更新而更新的更新过程包括:获得第二关系集合新增的对应关系,所述新增对应关系是第二文本输入信息和第三子文本信息的对应关系,所述第二文本输入信息是对应所述第三子文本信息的字符信息;获得对应所述第三子文本信息的第二子音频数据;依据所述第二子音频数据和第三子文本信息形成的对应关系更新所述第一关系集合。上述方法,优选的,所述方法在得到更新后的第一关系集合之后,还包括:获得第二音频输入;基于更新后的第一关系集合对所述第二音频输入进行语音识别。上述方法,优选的,在更新后的第一关系集合包括第一子音频数据和第二子文本信息的第一对应关系以及包括第一子音频数据和第一子文本信息的第二对应关系,且,第二音频输入包括所述第一子音频数据的情况下:如果所述第二音频输入和所述第一音频输入满足预定条件,则采用包括第二子文本信息的第二文本信息响应所述第二音频输入;如果所述第二音频输入和所述第一音频输入不满足所述预定条件,则按照匹配优先级,从所述第一对应关系和所述第二对应关系中选择匹配的子文本信息作为第三文本信息的一部分响应所述第二音频输入;其中,所述第一子音频数据为所述第一音频输入中与所述第一子文本信息对应的音频数据。上述方法,优选的,所述第二音频输入和所述第一音频输入满足预定条件包括下列中的至少一种:所述第二音频输入的输入时间和所述第一音频输入的输入时间的时间间隔小于预置时长;所述第二音频输入的输入位置和所述第一音频的输入位置满足相同的输入属性。上述方法,优选的,在更新所述第一关系集合时,获得第一音频输入的输入属性信息,并基于所述输入属性信息更新所述第一关系集合;所述第一关系集合包括输入信息、文本信息和输入属性信息的对应关系。上述方法,优选的,所述获得第一音频输入;获得所述第一音频输入对应的第一文本信息;获得第二子文本信息,包括:终端设备采集第一音频输入;终端设备对所述第一音频输入进行语音识别,得到所述第一音频输入对应的第一文本信息;终端设备采集第二子文本信息,以使得在终端设备利用所述第二子文本信息更新所述第一关系集合;或者,服务器接收终端设备采集的第一音频输入;服务器对所述第一音频输入进行语音识别,得到所述第一音频输入对应的第一文本信息,并发送所述第一文本信息至终端设备;服务器接收终端设备采集的所述第二子文本信息,以使得在服务器利用所述第二子文本信息更新所述第一关系集合。一种音频处理装置,包括:第一获取单元,用于获得第一音频输入;第二获取单元,用于获得所述第一音频输入对应的第一文本信息;第三获取单元,用于获得第二子文本信息,所述第二子文本信息是通过编辑所述第一文本信息中的第一子文本信息得到的;其中,所述第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。一种音频处理装置,包括:存储器,用于至少存储第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息;处理器,用于执行以下操作:获得第一音频输入;获得所述第一音频输入对应的第一文本信息;获得第二子文本信息,所述第二子文本信息是通过编辑所述第一文本信息中的第一子文本信息得到的;其中,所述第二子文本信息能用于更新所述第一关系集合。由以上方案可知,本申请提供的音频处理方法及装置,在获得第一音频输入并获得第一音频输入对应的第一文本信息后,获得通过编辑所述第一文本信息中的第一子文本信息得到的第二子文本信息,该第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。由于能够利用通过编辑所述第一文本信息中的第一子文本信息得到的第二子文本信息,对所述第一关系集合进行更新,从而可使得第一关系集合中输入信息和文本信息的匹配信息更为精准,后续,在基于更新后的第一关系集合进行信息匹配处理时,可进一步提升信息匹配的准确率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1是本申请实施例一提供的音频处理方法流程图;图2-图3是本申请实施例二提供的音频处理方法流程图;图4是本申请实施例三提供的基于第二关系集合的更新而更新第一关系集合的流程图;图5是本申请实施例四提供的音频处理方法流程图;图6是本申请实施例五提供的音频处理方法流程图;图7-图8是本申请实施例六提供的分别应用于不同的执行主体时音频处理方法的流程图;图9是本申请实施例七提供的音频处理装置的结构示意图;图10是本申请实施例十三提供的音频处理装置的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请提供一种音频处理方法及装置,以下将通过多个实施例对本申请的音频处理方法及装置进行说明。参考图1,是本申请提供的一种音频处理方法实施例一的流程图,该方法可应用于智能手机、平板电脑(PAD,PortableAndroidDevice)、个人数字助理(PDA(PersonalDigitalAssistan本文档来自技高网...

【技术保护点】
1.一种音频处理方法,包括:获得第一音频输入;获得所述第一音频输入对应的第一文本信息;获得第二子文本信息,所述第二子文本信息是通过编辑所述第一文本信息中的第一子文本信息得到的;其中,所述第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。

【技术特征摘要】
1.一种音频处理方法,包括:获得第一音频输入;获得所述第一音频输入对应的第一文本信息;获得第二子文本信息,所述第二子文本信息是通过编辑所述第一文本信息中的第一子文本信息得到的;其中,所述第二子文本信息能用于更新第一关系集合,所述第一关系集合包括输入信息和文本信息的对应关系,用于依据输入信息匹配对应的文本信息。2.根据权利要求1所述的方法,其中,所述输入信息和文本信息的对应关系包括下列对应关系中的至少一种:音频输入信息和文本信息的对应关系;或者,文本输入信息和文本信息的对应关系;其中,所述更新第一关系集合包括下列中的至少一种:依据第一子文本信息确定在所述第一音频输入中对应的第一子音频数据,将所述第一子音频数据作为第一音频输入信息;依据所述第一音频输入信息和第二子文本信息形成的对应关系更新所述第一关系集合;或者,依据第二子文本信息确定第二子文本信息对应的字符信息,所述字符信息是能输入形成所述第二子文本信息的信息,将所述字符信息作为第一文本输入信息;依据所述第一文本输入信息和第二子文本信息形成的对应关系更新所述第一关系集合。3.根据权利要求1所述的方法,其中,如果所述第一关系集合包括音频输入信息和文本信息的对应关系,所述第一关系集合还能够基于第二关系集合的更新而更新;所述第二关系集合包括文本输入信息和文本信息的对应关系;其中,第一关系集合基于第二关系集合的更新而更新的更新过程包括:获得第二关系集合新增的对应关系,所述新增对应关系是第二文本输入信息和第三子文本信息的对应关系,所述第二文本输入信息是对应所述第三子文本信息的字符信息;获得对应所述第三子文本信息的第二子音频数据;依据所述第二子音频数据和第三子文本信息形成的对应关系更新所述第一关系集合。4.根据权利要求1所述的方法,其中,所述方法在得到更新后的第一关系集合之后,还包括:获得第二音频输入;基于更新后的第一关系集合对所述第二音频输入进行语音识别。5.根据权利要求4所述的方法,其中,在更新后的第一关系集合包括第一子音频数据和第二子文本信息的第一对应关系以及包括第一子音频数据和第一子文本信息的第二对应关系,且,第二音频输入包括所述第一子音频数据的情况下:如果所述第二音频输入和所述第一音频输入满足预定条件,则采用包括第二子文本信息的第二文本信息响应所述第二音频输入;如果所述第二音频输入和所述第一音频输入不满足...

【专利技术属性】
技术研发人员:单震生
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1