一种语音信息的处理方法及终端技术

技术编号:13117723 阅读:74 留言:0更新日期:2016-04-06 08:42
本发明专利技术实施例公开了一种语音信息的处理方法,该方法应用于终端,所述方法包括:获得语音信号;识别所述语音信号,获得对应的文本信息;基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息,其中,所述会话历史数据库中存储有用户的会话历史记录。本发明专利技术实施例同时还提供一种终端。

【技术实现步骤摘要】

本专利技术涉及语音信息处理领域,尤其涉及一种语音信息的处理方法及终端
技术介绍
随着科技的发展,将语音信号转换成对应的文本信息这一技术越来越受到人们的青睐,该技术使得人们能够摆脱键盘的束缚,可以通过对输入的语音进行识别,获得对应的文本信息,以实现输入,方便用户使用。目前,以智能手机为例,当用户使用智能手机上安装的个人语音助手时,输入语音为“你在干吗呢?最近忙不忙啊?”,个人语音助手对该语音信息进行识别,可能由于用户周围的环境噪音较大、用户自己的语言习惯等因素,使得该语音助手不能准确地识别出用户输入的语音,所以识别出的文本信息就可能为“拟再干嘛呐?嘴紧忙吧忙啊?”,然后将该文本信息输出给用户,这样,用户看到的文本信息与其实际输入的内容差距较大,也就是说,终端不能够准确地识别出用户输入的语音内容。所以,现有技术中存在终端语音识别的准确率低的技术问题。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种语音信息的处理方法及终端,以提高终端语音识别的准确率,提高用户体验。为达到上述目的,本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供一种语音信息的处理方法,所述方法包括:获得语音信号;识别所述语音信号,获得对应的文本信息;基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息,其中,所述会话历史数据库中存储有用户的会话历史记录。进一步地,所述基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息,包括:基于预置在所述终端中的字词库,获得与所述文本信息关联的至少一个备选语句;将所述至少一个备选语句与所述会话历史数据库中的会话内容进行匹配,筛选出匹配程度最高的语句;将所述匹配程度最高的语句确定为所述纠错后的文本信息。进一步地,在所述获得纠错后的文本信息之后,所述方法还包括:将所述纠错后的文本信息存入所述会话历史数据库,更新所述会话历史数据库。进一步地,在所述获得纠错后的文本信息之后,所述方法还包括:输出所述纠错后的文本信息。第二方面,本专利技术实施例提供一种终端,所述终端包括:获得单元、识别单元及纠错单元;其中,所述获得单元,用于获得语音信号;所述识别单元,用于识别所述终端中的语音信号,获得对应的文本信息;所述纠错单元,用于基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息;其中,所述会话历史数据库中存储有用户的会话历史记录。进一步地,所述纠错单元,具体用于基于预置在所述终端中的字词库,获得与所述文本信息关联的至少一个备选语句;将所述至少一个备选语句与所述会话历史数据库中的会话内容进行匹配,筛选出匹配程度最高的语句;将所述匹配程度最高的语句确定为所述纠错后的文本信息。进一步地,所述终端还包括更新单元,用于在获得纠错后的文本信息之后,将所述纠错后的文本信息存入所述会话历史数据库,更新所述会话历史数据库。进一步地,所述终端还包括输出单元,用于在获得纠错后的文本信息之后,输出所述纠错后的文本信息。本专利技术实施例所提供的语音信息的处理方法及终端,当终端获得语音信号后,对该语音信号进行识别,获得对应的文本信息,然后,基于预置在终端中的存储有用户的会话历史记录的会话历史数据库,终端对文本信息进行纠错,获得纠错后的文本信息,此时,纠错后的文本信息是与用户的会话历史记录匹配程度最高的,也就是最符合上下文的语境的,那么,纠错后的文本信息也是最为贴近用户实际输入的语音内容的,如此,有效地解决了现有技术存在的终端语音识别的准确率低的技术问题,提高了终端语音识别的准确率,提高用户体验。附图说明图1为本专利技术实施例中的语音信息的处理方法的流程示意图;图2为本专利技术实施例中的文本信息纠错方法的流程示意图;图3为本专利技术实施例中的终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。本专利技术实施例提供一种语音信息的处理方法,该方法应用于终端上,该终端可以为智能手机、平板电脑等设备。图1为本专利技术实施例中语音信息的处理方法的流程示意图,参考图1所示,该方法包括:S101:获得语音信号;具体来说,当用户使用个人语音助手,或者与其他用户进行即时聊天时,用户可以通过语音唤醒、点击物理按键等方式开启终端的语音识别功能,此时,用户对着终端的麦克风输入语音,终端获得该语音的语音信号。例如,用户A和用户B正在进行即时聊天,用户A输入的会话内容为“你在干吗呢?”,用户B输入的会话内容为“没干嘛啊,你呢?”,用户A接着输入会话内容为“一样,你在哪?”,此时,用户B唤醒终端,并语音输入“我在家,你呢?”,那么,终端获得用户B输入的语音所对应的语音信号。S102:识别语音信号,获得对应的文本信息;具体来说,在终端获得上述语音信号之后,通过预定的采样率得到语音信号对应的音频流,并将该音频流作为语音识别引擎的输入,以此来对语音信号进行识别,获得语音信号对应的文本信息。但是由于用户进行语音输入时,可能周围的噪音较大或用户自己的语言习惯等因素,导致获得的文本信息与用户实际想要表达的意思不一致。比如,终端对获得的用户B的语音信号进行语音识别,语音识别出现偏差,得到的用户B的语音对应的文本信息就为“偶在假,你那?”。在实际应用中,上述预定的采样率可以为16KHz,也可以为22KHz,当然,采样率还可以为其他取值,本申请不做具体限定。S103:基于预置在终端中的会话历史数据库,对文本信息进行纠错,获得纠错后的文本信息;首先,需要说明的是,在实际应用中,终端中预置有字词库和会话历史数据库,其中,字词库中可以存储有所有的字词句,类似于存储在终端中的字典或者词典;另外,字词库还可以在初始时仅存储一些常用的字词句,并在之后用户的使用过程中,根据用户语音输入或者文本输入的内容进行学习,将用户常用的字词添加到该字词库中,来扩充字词库。进一步地,在本实施例中,字词库中所有的字、词可以根据用户使用每个字或者词的频率,由大到小排列,如下表1所示,C1列为使用频率最高的字,C2列为使用频率次高的字,依次类推;R1行为读音为“WO”的所有字,R2为发音为“ZAI”的所有字,依次类推。C1C2C3C4R1我偶窝喔R2在再载本文档来自技高网...

【技术保护点】
一种语音信息的处理方法,应用于终端,其特征在于,所述方法包括:获得语音信号;识别所述语音信号,获得对应的文本信息;基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息,其中,所述会话历史数据库中存储有用户的会话历史记录。

【技术特征摘要】
1.一种语音信息的处理方法,应用于终端,其特征在于,所述方法包括:
获得语音信号;
识别所述语音信号,获得对应的文本信息;
基于预置在所述终端中的会话历史数据库,对所述文本信息进行纠错,获
得纠错后的文本信息,其中,所述会话历史数据库中存储有用户的会话历史记
录。
2.根据权利要求1所述的方法,其特征在于,所述基于预置在所述终端中
的会话历史数据库,对所述文本信息进行纠错,获得纠错后的文本信息,包括:
基于预置在所述终端中的字词库,获得与所述文本信息关联的至少一个备
选语句;
将所述至少一个备选语句与所述会话历史数据库中的会话内容进行匹配,
筛选出匹配程度最高的语句;
将所述匹配程度最高的语句确定为所述纠错后的文本信息。
3.根据权利要求1所述的方法,其特征在于,在所述获得纠错后的文本信
息之后,所述方法还包括:
将所述纠错后的文本信息存入所述会话历史数据库,更新所述会话历史数
据库。
4.根据权利要求1所述的方法,其特征在于,在所述获得纠错后的文本信
息之后,所述方法还包括:
输出所述纠错后的文本信息。
5...

【专利技术属性】
技术研发人员:李向阳
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1