语音识别方法、装置、可读存储介质和电子设备制造方法及图纸

技术编号:22755968 阅读:40 留言:0更新日期:2019-12-07 04:21
本发明专利技术实施例公开了一种语音识别方法、装置、可读存储介质和电子设备,所述方法根据用户输入语音信息获取文本序列和特征因子集合,所述特征因子集合中至少包括词向量序列和语音序列集合,并通过将所述文本序列和所述特征因子集合中的至少一个特征因子输入预先训练好的模型中以确定用户意图。所述方法通过增加语音识别模型的输入因子提高所述语音识别过程的准确率。

Speech recognition method, device, readable storage medium and electronic equipment

The embodiment of the invention discloses a speech recognition method, device, readable storage medium and electronic device. The method obtains a text sequence and a set of feature factors according to the speech information input by the user. The set of feature factors includes at least a combination of a word vector sequence and a speech sequence, and by combining the text sequence with at least one feature factor in the set of feature factors Input the pre trained model to determine the user intention. The method improves the accuracy of the speech recognition process by increasing the input factors of the speech recognition model.

【技术实现步骤摘要】
语音识别方法、装置、可读存储介质和电子设备
本专利技术涉及语音识别领域,尤其涉及一种语音识别方法、装置、可读存储介质和电子设备。
技术介绍
随着科技的发展,人在与终端之间的沟通可以不通过输入文字,仅仅通过语音的方法进行,在所述沟通过程中,终端需要对用户说的话进行解析和识别,以确定用户的意图。目前在进行语音识别的过程中,往往会因为输入的语音不清楚或内容较为复杂使语音识别的准确率不高,导致终端根据输入的语音信息误判用户的意图。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音识别方法、装置、可读存储介质和电子设备,旨在提高语音识别过程中的准确度,避免对用户意图的误判。第一方面,本专利技术实施例提供一种语音识别方法,所述方法包括:获取目标语音信息;根据所述目标语音信息确定对应的文本序列;根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;根据所述目标语音信息将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。进一步地,所述根据所述目标语音信息确定特征因子集合包括;根据所述文本序列确定词向量序列;根据所述文本序列确定拼音序列;根据所述词向量序列和拼音序列集合确定特征因子集合。进一步地,所述根据所述文本序列确定拼音序列具体为:根据所述文本序列确定包括音调的第一拼音序列和/或不包括音调的第二拼音序列。进一步地,所述特征因子集合还包括语音片段集合;所述根据所述目标语音信息确定特征因子集合还包括:根据所述目标语音信息确定语音片段集合,所述语音片段集合中包括至少一个语音片段;根据所述语音片段集合、词向量序列和拼音序列集合确定特征因子集合。进一步地,所述特征因子集合还包括语音向量;所述根据所述目标语音信息确定特征因子集合还包括:根据所述目标语音信息确定语音向量,所述语音向量用于表征语音文件中的停顿状态;根据所述语音片段集合、语音向量、词向量序列和拼音序列集合确定特征因子集合。第二方面,本专利技术实施例提供了一种语音识别装置,所述装置包括:语音获取模块,用于获取目标语音信息。文本确定模块,用于根据所述目标语音信息确定对应的文本序列。特征提取模块,用于根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列。根据所述目标语音信息意图预测模块,用于将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。第三方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中任一项所述的方法。第四方面,本专利技术实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如下所述步骤:获取目标语音信息;根据所述目标语音信息确定对应的文本序列;根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。进一步地,所述根据所述目标语音信息确定特征因子集合包括;根据所述文本序列确定词向量序列;根据所述文本序列确定拼音序列;根据所述词向量序列和拼音序列集合确定特征因子集合。进一步地,所述根据所述文本序列确定拼音序列具体为:根据所述文本序列确定包括音调的第一拼音序列和/或不包括音调的第二拼音序列。进一步地,所述特征因子集合还包括语音片段集合;所述根据所述目标语音信息确定特征因子集合还包括:根据所述目标语音信息确定语音片段集合,所述语音片段集合中包括至少一个语音片段;根据所述语音片段集合、词向量序列和拼音序列集合确定特征因子集合。进一步地,所述特征因子集合还包括语音向量;所述根据所述目标语音信息确定特征因子集合还包括:根据所述目标语音信息确定语音向量,所述语音向量用于表征语音文件中的停顿状态;根据所述语音片段集合、语音向量、词向量序列和拼音序列集合确定特征因子集合。所述方法根据用户输入语音信息获取文本序列和特征因子集合,所述特征因子集合中至少包括词向量序列和语音序列集合,并通过将所述文本序列和所述特征因子集合中的至少一个特征因子输入预先训练好的模型中以确定用户意图,起到通过增加语音识别模型的输入因子提高所述语音识别过程的准确率的效果。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1为本专利技术实施例的语音识别方法的流程图;图2为本专利技术实施例的向预测模型输入文本序列和词向量序列的语音识别方法的示意图;图3为本专利技术实施例的向预测模型输入文本序列和拼音序列集合的语音识别方法的示意图;图4为本专利技术实施例的向预测模型输入文本序列、拼音序列集合和词向量序列的语音识别方法的示意图;图5为本专利技术实施例的向预测模型输入文本序列、拼音序列集合、词向量序列和语音片段集合的语音识别方法的示意图;图6为本专利技术实施例的向预测模型输入文本序列、拼音序列集合、词向量序列、语音片段集合和语音向量的语音识别方法的示意图;图7为本专利技术实施例的语音识别装置的示意图;图8为本专利技术实施例的电子设备的示意图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。为了避免混淆本专利技术的实质,公知的方法、过程、流程并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则整个说明书中的“包括”、“包括”等类似词语应当解释为包括的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。图1为本专利技术实施例的语音识别方法的流程图,如图1所示,所述语音识别方法包括:步骤S100:获取目标语音信息。具体地,所述目标语音本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n获取目标语音信息;/n根据所述目标语音信息确定对应的文本序列;/n根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;/n将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定所述目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
获取目标语音信息;
根据所述目标语音信息确定对应的文本序列;
根据所述目标语音信息确定特征因子集合,所述特征因子集合中至少包括词向量序列和拼音序列集合,所述拼音序列集合包括至少一个拼音序列;
将所述特征因子集合中的至少一个元素和所述文本序列输入预测模型中以确定所述目标语音信息表征的意图信息,所述预测模型根据预先标注的语音库预先训练得到。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音信息确定特征因子集合包括;
根据所述文本序列确定词向量序列;
根据所述文本序列确定拼音序列;
根据所述词向量序列和拼音序列集合确定特征因子集合。


3.根据权利要求2所述的方法,其特征在于,所述根据所述文本序列确定拼音序列具体为:
根据所述文本序列确定包括音调的第一拼音序列和/或不包括音调的第二拼音序列。


4.根据权利要求2所述的方法,其特征在于,所述特征因子集合还包括语音片段集合;
所述根据所述目标语音信息确定特征因子集合还包括:
根据所述目标语音信息确定语音片段集合,所述语音片段集合中包括至少一个语音片段;
根据所述语音片段集合、词向量序列和拼音序列集合确定特征因子集合。


5.根据权利要求4所述的方法,其特征在于,所述特征因子集合还包括语音向量;
所述根据所述目标语音信息确定特征因子集合还包括:
根据所述目标语音信息确定语音向量,所述语音向量用于表征语音文件中的停顿状态;
根据所述语音片段集合、语音向量、词向量序列和拼音序列集合确定特征因子集合。


6.一种语音识别装置,其特征在于,所述装置包括:
语音获取模块,用于...

【专利技术属性】
技术研发人员:叶俊杰王乾赵扬
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1