【技术实现步骤摘要】
一种语音识别方法、智能终端及存储介质
[0001]本专利技术涉及语音识别
,尤其涉及一种语音识别方法、智能终端及存储介质。
技术介绍
[0002]相较于拼音、字形等文本输入方式,语音输入方式具有速度快、操作便捷等优点,被应用到越来越多的场景中。但是,受到汉语多字同音、方言、发音不标准以及噪音等因素的影响,语音识别结果错误的情况时有发生,给用户使用带来不便,影响了语音识别产品的推广。
[0003]因此,现有技术还有待改进和发展。
技术实现思路
[0004]专利技术人发现,在现有技术中,语音识别的错误点往往出现在专有名词上,而专有名词是用户整句话的重点,例如,对于智能电视来说,用户使用语音识别进行搜索观看时,会说出包含电视剧名、人名、歌曲名等的句子,如“我想看琅琊榜”等,而智能电视必须要识别出电视剧名、人名、歌曲名等专有字符串,才能执行正确的搜索,达成用户的目的。然而,由于汉语中多字同音、方言以及周围噪音的影响,在现有技术中,对电视剧名、人名、歌曲名等专有字符串的识别会存在误差,如将“我想看琅琊榜” ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括:获取语音信息对应的文本,提取出所述文本中的第一字符串,并将所述第一字符串与目标数据库中的预设字符串进行匹配;当所述目标数据库中不存在与所述第一字符串相同的预设字符串时,获取所述目标数据库中与所述第一字符串对应的目标预设字符串;将所述文本中的所述第一字符串替换为所述目标预设字符串,将替换后的所述文本作为所述语音信息的识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,所述将所述第一字符串与目标数据库中的预设字符串进行匹配包括:获取所述语音信息对应的专业类别;根据所述专业类别在预先设置的至少一个数据库中选取所述专业类别对应的数据库,并将所述数据库作为所述目标数据库;将所述第一字符串与所述目标数据库中的预设字符串进行匹配。3.根据权利要求2所述的语音识别方法,其特征在于,所述提取出所述文本中的第一字符串具体包括:将所述文本输入至所述专业类别对应的第一模型中,获取所述第一模型输出的所述第一字符串;其中,所述第一模型是根据第一数据集训练而成的,所述第一数据集包括多组第一样本,每组第一样本中包括所述专业类别中的样本文本以及样本文本对应的样本第一字符串。4.根据权利要求1所述的语音识别方法,其特征在于,所述获取所述目标数据库中与所述第一字符串对应的目标预设字符串具体包括:获取所述第一字符串对应的第一音节序列;将所述第一音节序列输入至预先训练的第二模型,获取所述第二模型输出的第二音节序列;其中,所述第二模型是根据第二数据集训练而成的,所述第二数据集包括多组第二样本,每组第二样本中包含样本音节序列以及样本音节序列对应的样本第二音节序列,其中,所述样本第二音节序列是所述目标数据库中的一预设字符串对应的音节序列;根据所述第二音节序列确定所述目标预设字符串。5.根据权利要求4所述的语音识别方法,其特征在于,所述根据所述第二音节序列获取所述目标预设字符串包括:当所述目标数据库中不存在...
【专利技术属性】
技术研发人员:潘弘海,
申请(专利权)人:深圳TCL数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。