【技术实现步骤摘要】
基于深度学习的人工智能语音识别方法、装置及介质
[0001]本专利技术涉及语音识别
,具体是基于深度学习的人工智能语音识别方法、装置及介质。
技术介绍
[0002]随着科学技术的发展,计算机装置的应用覆盖了人们工作和生活的方方面面,与此同时,用户对于计算机装置的要求也越来越高。在计算机装置的使用过程中,存在许多需要输入文字的场景,例如在文档中输入文字、在搜索栏中输入文字等。
[0003]在一般消费者领域,现有的语音转文字准确率较低,因为汉语中存在很多同音词,仅通过语音特征将语音转换为文字的准确率有待提高。
技术实现思路
[0004]有鉴于此,本专利技术的目的是提供基于深度学习的人工智能语音识别方法、装置及介质,能够提高语音转文字的准确率。
[0005]为了实现上述目的,本专利技术采用了如下技术方案:
[0006]本专利技术的一种基于深度学习的人工智能语音识别方法,包括步骤:
[0007]获取用户的历史语音信息、历史文字输入信息和历史文字输入信息的相关词;
[000 ...
【技术保护点】
【技术特征摘要】
1.基于深度学习的人工智能语音识别方法,其特征在于:包括步骤;获取用户的历史语音信息、历史文字输入信息和历史文字输入信息的相关词;根据通过预先建立的语音识别模型对所述历史语音信息进行识别,获得识别结果;将所述识别结果与所述历史文字输入信息和所述相关词进行对比,并在所述识别结果与所述历史文字输入信息或者所述相关词匹配的情况下,以所述历史语音信息、所述历史文字输入信息和所述相关词构建数据样本;根据所述数据样本对所述语音识别进行训练,获得更新后的语音识别模型;基于更新后的语音识别模型对语音信息进行识别。2.根据权利要求1所述的基于深度学习的人工智能语音识别方法,其特征在于:根据通过预先建立的语音识别模型对所述历史语音信息进行识别,获得识别结果,包括:将所述历史语音信息转换为脉冲调制波形,并将所述脉冲调制波形映射至二维坐标系中,所述二维坐标系包括X轴和Y轴,其中X轴为时间轴,Y轴为幅值轴;从所述脉冲调制波形中提取出拐点Q
i
和特征点Q
i
',并按照时间顺序生成包含拐点Q
i
和特征点Q
i
'的特征集合S;将特征集合S输入至所述语音识别模型中,获得识别结果。3.根据权利要求2所述的基于深度学习的人工智能语音识别方法,其特征在于:从所述脉冲调制波形中提取出拐点Q
i
和特征点Q
i
',包括:计算所述脉冲调制波形任意两个相邻数据点A
i
和A
i
‑1之间的幅值差
‑
‑1;当有任何一个数据点满足:则提取数据点并作为拐点Q
i
;当有任何两个数据点
‑1和满足:|
‑
‑1|>或者|
‑
‑1|<β,将数据点
‑1和数据点并作为特征点Q
i
';其中α为第一阈值,β为第二阈值。4.根据权利要求2所述的基于深度学习的人工智能语音识别方法,其特征在于:所述语音识别模型的建立步骤包括:获取包含正样本和样本的初始数据集,所述正样本为包含特征集合S的脉冲调制数据,所述负样本为不包含特征集合S的脉冲调制数据;将正样本中的特征集合S进行幅值缩放和整体位移,获得训练数据集;根据所述训练数据集对预先设...
【专利技术属性】
技术研发人员:陈强,
申请(专利权)人:重庆软江图灵人工智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。