The embodiment of the invention discloses a speech recognition method, device, readable storage medium and electronic device. The method obtains a text sequence and a set of feature factors according to the speech information input by the user. The set of feature factors includes at least a combination of a word vector sequence and a speech sequence, and by combining the text sequence with at least one feature factor in the set of feature factors Input the pre trained model to determine the user intention. The method improves the accuracy of the speech recognition process by increasing the input factors of the speech recognition model.
【技术实现步骤摘要】
语音识别方法、装置、可读存储介质和电子设备
本专利技术涉及语音识别领域,尤其涉及一种语音识别方法、装置、可读存储介质和电子设备。
技术介绍
随着科技的发展,人在与终端之间的沟通可以不通过输入文字,仅仅通过语音的方法进行,在所述沟通过程中,终端需要对用户说的话进行解析和识别,以确定用户的意图。目前在进行语音识别的过程中,往往会因为输入的语音不清楚或内容较为复杂使语音识别的准确率不高,导致终端根据输入的语音信息误判用户的意图。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音识别方法、装置、可读存储介质和电子设备,旨在提高语音识别过程中的准确度,避免对用户意图的误判。第一方面,本专利技术实施例提供一种语音识别方法,所述方法包括:获取目标语音信息;根据所述目标语音信息确定对应的文本序列;根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;根据所述目标语音信息将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。进一步地,所述根据所述目标语音信息确定特征因子集合包括;根据所述文本序列确定词向量序列;根据所述文本序列确定拼音序列;根据所述词向量序列和拼音序列集合确定特征因子集合。进一步地,所述根据所述文本序列确定拼音序列具体为:根据所述文本序列确定包括音调 ...
【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n获取目标语音信息;/n根据所述目标语音信息确定对应的文本序列;/n根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;/n将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定所述目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。/n
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
获取目标语音信息;
根据所述目标语音信息确定对应的文本序列;
根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;
将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定所述目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音信息确定特征因子集合包括;
根据所述文本序列确定词向量序列;
根据所述文本序列确定拼音序列;
根据所述词向量序列和拼音序列集合确定特征因子集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本序列确定拼音序列具体为:
根据所述文本序列确定包括音调的第一拼音序列和/或不包括音调的第二拼音序列。
4.根据权利要求2所述的方法,其特征在于,所述特征因子集合还包括语音片段集合;
所述根据所述目标语音信息确定特征因子集合还包括:
根据所述目标语音信息确定语音片段集合,所述语音片段集合中包括至少一个语音片段;
根据所述语音片段集合、词向量序列和拼音序列集合确定特征因子集合。
5.根据权利要求4所述的方法,其特征在于,所述特征因子集合还包括语音向量;
所述根据所述目标语音信息确定特征因子集合还包括:
根据所述目标语音信息确定语音向量,所述语音向量用于表征语音文件中的停顿状态;
根据所述语音片段集合、语音向量、词向量序列和拼音序列集合确定特征因子集合。
6.一种语音识别装置,其特征在于,所述装置包括:
语音获取模块,用于...
【专利技术属性】
技术研发人员:叶俊杰,王乾,赵扬,
申请(专利权)人:拉扎斯网络科技上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。