语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24614904 阅读:22 留言:0更新日期:2020-06-24 01:53
本申请提供了一种语音识别方法、装置、电子设备及存储介质,包括:接收用户输入的语音信息;将语音信息转换成至少一个文本信息;将至少一个文本信息输入动态语言模型,获得动态语言模型输出的每个文本信息的第一命中概率;获得第一命中概率最高的文本信息。本申请实施例可以先将用户的语音信息转换成至少一个文本信息,然后将文本信息输入到动态语言模型中,由动态语言模型来获得每个文本信息的命中概率,然后选出命中概率最高的文本信息。由于动态语言模型是根据同一用户的历史数据信息作为样本训练获得的,因此,该动态语言模型输出的概率更贴近用户的使用习惯,从而有利于提高语音识别的准确率。

Speech recognition method, device, electronic equipment and storage medium

【技术实现步骤摘要】
语音识别方法、装置、电子设备及存储介质
本申请涉及语音识别
,具体而言,涉及一种语音识别方法、装置、电子设备及存储介质。
技术介绍
近年来,随着移动通信技术的快速发展,大量基于智能终端的应用程序(Application,APP)涌现了出来。叫车类APP是其中很受大众欢迎的一类。乘客可通过在APP输入出发地和目的地信息,发起用车请求,司机接收到订单之后根据乘客的出发地信息前去接驾。用户在使用网约车时,可通过语音输入或文本输入的方式输入出发地信息和目的地信息,从而发起订单请求。对于通过语音输入的方式,通常是对用户输入的语音进行识别,并根据语音识别结果进行派单。现实生活中,相同的文字由不同的人表述可能会产生不同的语音,因此现有技术中对用户的语音识别往往存在识别准确率不高的问题。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种语音识别方法、装置、电子设备及存储介质,能够通过每个用户不同的动态语言模型来对用户的语音信息进行识别,从而改善现有技术中对用户的语音识别存在的识别准确率不高的问题。一方面,本申请实施例提供一种语音本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n接收用户输入的语音信息;/n将所述语音信息转换成至少一个文本信息;/n将所述至少一个文本信息输入动态语言模型,获得所述动态语言模型输出的所述至少一个文本信息中每个文本信息的第一命中概率,所述动态语言模型以所述用户的历史数据信息作为样本训练得到;/n获得第一命中概率最高的文本信息。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
接收用户输入的语音信息;
将所述语音信息转换成至少一个文本信息;
将所述至少一个文本信息输入动态语言模型,获得所述动态语言模型输出的所述至少一个文本信息中每个文本信息的第一命中概率,所述动态语言模型以所述用户的历史数据信息作为样本训练得到;
获得第一命中概率最高的文本信息。


2.根据权利要求1所述的方法,其特征在于,在所述接收用户输入的语音信息之后,所述方法还包括:
获取所述用户的第一时间段内的历史数据信息,所述历史数据信息包括多个历史目标地点以及多个历史目标地点中每个历史目标地点所占的权重值;
将所述多个历史目标地点以及所述多个历史目标地点中每个历史目标地点所占的权重值作为样本,对所述动态语言模型进行训练,获得训练后的动态语言模型,其中,所述多个历史目标地点作为输入量,所述多个历史目标地点中每个历史目标地点所占的权重值作为输出量。


3.根据权利要求1所述的方法,其特征在于,在将所述语音信息转换成具有相同发音的至少一个文本信息之后,所述方法还包括:
将所述至少一个文本信息输入通用语言模型,获得所述通用语言模型输出的所述至少一个文本信息中每个文本信息的第二命中概率;
获得所述第二命中概率最高的文本信息;
将所述第一命中概率最高的文本信息与所述第二命中概率最高的文本信息进行比较,获得两者中的命中概率高的文本信息,并将该文本信息作为目标地点。


4.根据权利要求3所述的方法,其特征在于,在所述将所述第一命中概率最高的文本信息与所述第二命中概率最高的文本信息进行比较,获得两者中的命中概率高的文本信息,并将该文本信息作为目标地点之后,所述方法还包括:
删除所述动态语言模型。


5.根据权利要求2所述的方法,其特征在于,所述历史目标地点包括历史起始地点以及历史目的地点中至少一项。


6.根据权利要求1所述的方法,其特征在于,所述将所述语音信息转换成至少一个文本信息,包括:
按照预设时间长度将所述语音信息划分为多帧音频信息;
将所述多帧音频信息中第一数量的连续帧的音频信息组成第一音节;
将所述多帧音频信息中第一音节后的第二数量的连续帧的音频信息组成第二音节;
根据所述第一音节和第二音节确定所述语音信息的至少一个发音;
将所述语音信息转换成与该语音信息具有相同发音的至少一个文本信息。


7.一种语音识别装置,其特征在于,所述装置包括:
语音信息接收模块,用于接收用户输入的语音信息;
文本转换模块,用于将所述语音信息转换成至少一个文本信息;
第一概率获得模块,用于将所述至少一个文本信息输入动态语言模型,获得所述动态语言...

【专利技术属性】
技术研发人员:邓耀王飞
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利