语种识别方法和装置制造方法及图纸

技术编号:36954485 阅读:65 留言:0更新日期:2023-03-22 19:14
本申请公开了一种语种识别方法和装置,其中方法包括:当智能设备需要对与其进行语音交互的目标对象进行语种识别时,基于所述目标对象的语音信号,利用预先训练的语种预测模型进行语种预测;基于所述语种预测模型的输出结果和预设的置信度差值阈值,确定是否需要对所述语种预测模型的输出结果进行修正;如果需要进行所述修正,则基于当前环境中的语种相关特征,对所述输出结果进行优化,得到所述目标对象使用的语种,否则,选择所述输出结果中置信度最大的语种,作为所述目标对象使用的语种。本申请通过基于环境中的语种相关特征,对语种预测模型的输出结果进行修正,可以提高基于语音进行语种识别的准确度。音进行语种识别的准确度。音进行语种识别的准确度。

【技术实现步骤摘要】
语种识别方法和装置


[0001]本专利技术涉及人工智能技术,特别是涉及一种语种识别方法和装置。

技术介绍

[0002]语种识别是根据输入的文本和语音识别该文本和语音对应的语言(即语种)。目前基于文本的语种识别比较简单成熟。但是,基于语音的语种识别技术还不是很成熟。在商用系统中仍然还是通过手动设置语言。这种手动设置的方式不能有效适应交互语言多变的场合。
[0003]语种识别技术可以帮助语音助手解析用户的语音交互内容,并根据内容提供进一步的服务。语种识别的精度对语音识别有着较为重要的影响,准确的语种识别可以提升系统对多语音交互内容分析的准确性,进而可以为用户提供更优质的语音交互体验。尤其是,准确的语种识别结果可以成为公共设备为不同语种用户的服务基础,并可以针对用户个人使用的语种,提供差异性的服务。
[0004]专利技术人在实现本申请的过程中发现:现有的基于语音的语种识别技术无法提供准确、可靠的语种识别结果。具体原因为:现有方案主要是利用预先训练的语音预测模型进行语种识别。但是,语音预测模型并不能确保所输出的语种分析结果具有高区分度,这样,就无法基于语音预测模型的输出结果,做出准确的语种设置,从而无法确保应用系统对语音交互内容的准确分析,进而无法为用户提供可靠的语音交互服务。

技术实现思路

[0005]有鉴于此,本专利技术的主要目的在于提供一种语种识别方法和装置,可以提高基于语音进行语种识别的准确度。
[0006]为了达到上述目的,本专利技术实施例提出的技术方案为:
[0007]一种语种识别方法,包括:
[0008]当智能设备需要对与其进行语音交互的目标对象进行语种识别时,基于所述目标对象的语音信号,利用预先训练的语种预测模型进行语种预测;
[0009]基于所述语种预测模型的输出结果和预设的置信度差值阈值,确定是否需要对所述语种预测模型的输出结果进行修正;
[0010]如果需要进行所述修正,则基于当前环境中的语种相关特征,对所述输出结果进行优化,得到所述目标对象使用的语种,否则,选择所述输出结果中置信度最大的语种,作为所述目标对象使用的语种。
[0011]本专利技术实施例还提出一种语种识别装置,包括:
[0012]语音预测单元,用于当智能设备需要对与其进行语音交互的目标对象进行语种识别时,基于所述目标对象的语音信号,利用预先训练的语种预测模型进行语种预测;
[0013]修正决策单元,用于基于所述语种预测模型的输出结果和预设的置信度差值阈值,确定是否需要对所述语种预测模型的输出结果进行修正;
[0014]修正单元,用于在需要进行所述修正时,基于当前环境中的语种相关特征,对所述输出结果进行优化,得到所述目标对象使用的语种,在不需要进行所述修正时,选择所述输出结果中置信度最大的语种,作为所述目标对象使用的语种。
[0015]本专利技术实施例还提出一种电子设备,包括处理器和存储器;
[0016]所述存储器中存储有可被所述处理器执行的应用程序,用于使得所述处理器执行如上所述语种识别方法。
[0017]本专利技术实施例还提出一种计算机可读存储介质,其中存储有计算机可读指令,该计算机可读指令用于执行如上所述语种识别方法。
[0018]综上所述,本专利技术实施例提出的语种识别方案,对基于语音的语种预测模型的输出结果是否需要修正,进行判断,并在需要修正时,利用环境中的语种相关特征对该输出结果进行修正,如此,可以克服基于语音的语种识别结果的区分度低时对语种识别准确度的影响,从而可以有效提高基于语音进行语种识别的准确度。
附图说明
[0019]图1为本专利技术实施例的语种识别方法流程示意图;
[0020]图2为本专利技术实施例中基于当前环境中的语种相关特征对模型输出结果进行优化的流程示意图;
[0021]图3为本专利技术实施例中基于当前环境中的语种相关特征和修正语种候选集合,确定目标对象使用语种的流程示意图;
[0022]图4为采用本专利技术实施例对模型预测结果进行修正的示例图;
[0023]图5~图8为本专利技术实施例在具体情景中的应用示例图;
[0024]图9为本专利技术实施例的语种识别装置结构示意图。
具体实施方式
[0025]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术作进一步地详细描述。
[0026]图1为本专利技术实施例的语种识别方法流程示意图,如图1所示,该实施例实现的语种识别方法主要包括:
[0027]步骤101、当智能设备需要对与其进行语音交互的目标对象进行语种识别时,基于所述目标对象的语音信号,利用预先训练的语种预测模型进行语种预测。
[0028]本步骤,用于在需要进行语种识别时,先将交互对象的语音信号,输入预先训练的语种预测模型,由语种预测模型基于交互对象的语音信号,进行语种预测,语种预测模型将输出一个语种列表,其中包含各语种对应的置信度。具体可以采用现有基于语音的语种预测模型实现本步骤的语种识别,在此不再赘述。
[0029]在实际应用中,智能设备需要对与其进行语音交互的目标对象进行语种识别的时机,可由本领域技术人员根据实际需要设置。例如,当智能设备检测到目标对象开始与本设备进行语音交互时,但不限于此。
[0030]步骤102、基于所述语种预测模型的输出结果和预设的置信度差值阈值,确定是否需要对所述语种预测模型的输出结果进行修正。
[0031]本步骤中,为了解决语种预测模型可能会输出低辨识度语种识别结果的问题,将进一步判断是否需要对语种预测模型输出结果进行修正,以便在语种预测模型输出结果的辨识度较低时,利用当前环境中的语种相关特征,对语种预测模型输出结果进行修正,从而可以提高语种识别的准确性。
[0032]所述置信度差值阈值,为用于判断两个语种的置信度是不是明显可区分,当两个语种之间的置信度差值小于等于该阈值时,说明这两个语种的置信度之间区分度小。本领域技术人员可基于上述原则,根据实际应用需要,设置置信度差值阈值的合适取值。
[0033]一种实施方式中,可以基于语种预测模型的输出结果中前两个置信度最大的两个语种之间的区分度,来确定是否需要对上述输出结果进行修正,具体地,可以采用下述方法实现:
[0034]如果第一语种序列中的首个语种和第二个语种的置信度差值不大于所述置信度差值阈值,则判定需要进行所述修正。
[0035]所述第一语种序列为按照置信度降序对所述输出结果中的语种排序后得到的序列。
[0036]这里,第一语种序列中的首个语种是模型输出结果中置信度最大的语种,如果第一语种序列中的首个语种和第二个语种的置信度差值不大于预设的置信度差值阈值,说明这两个语种之间的区分度小,此时无法确保模型输出的置信度最大的语种即为目标对象使用的语种,因此,此时会判定需要进行所述修正。反之,如果第一语种序列中的首个语种和第二个语种的置信度差值大于所述置信度差值阈值,说明这两个语种之间的区分度大,此时,可以确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语种识别方法,其特征在于,包括:当智能设备需要对与其进行语音交互的目标对象进行语种识别时,基于所述目标对象的语音信号,利用预先训练的语种预测模型进行语种预测;基于所述语种预测模型的输出结果和预设的置信度差值阈值,确定是否需要对所述语种预测模型的输出结果进行修正;如果需要进行所述修正,则基于当前环境中的语种相关特征,对所述输出结果进行优化,得到所述目标对象使用的语种,否则,选择所述输出结果中置信度最大的语种,作为所述目标对象使用的语种。2.根据权利要求1所述的方法,其特征在于,所述确定是否需要对所述语种预测模型的输出结果进行修正包括:如果第一语种序列中的首个语种和第二个语种的置信度差值不大于所述置信度差值阈值,则判定需要进行所述修正;其中,所述第一语种序列为按照置信度降序对所述输出结果中的语种排序后的序列。3.根据权利要求1所述的方法,其特征在于,所述基于当前环境中的语种相关特征,对所述输出结果进行优化,得到所述目标对象使用的语种包括:从第一语种序列中提取出候选序列,基于所述候选序列,得到修正语种候选集合;所述第一语种序列为按照置信度降序对所述输出结果中的语种排序后的序列;所述候选序列满足:序列中相邻语种之间的置信度差值小于等于所述置信度差值阈值,且序列的首个语种为所述第一语种序列的首个语种;基于当前环境中的语种相关特征和所述修正语种候选集合,确定所述目标对象使用的语种。4.根据权利要求3所述的方法,其特征在于,所述基于当前环境中的语种相关特征和所述修正语种候选集合,确定所述目标对象使用的语种包括:获取当前环境中每个对象的语种相关特征;按照对象的语种关联度等级,对所有所述对象的所述语种相关特征进行分类,得到每种语种关联度等级对应的语种相关特征集合;对于每个所述语种相关特征集合,确定该语种相关特征集合中每个语种相关特征对应的特征相关语种向量,并基于所有所述特征相关语种向量,生成该语种相关特征集合的集合相关语种向量;其中,所述向量中的每个元素包括语种和相应的语种关联度系数;按照语种关联度等级的降序,依次遍历所述语种相关特征集合,基于所遍历的语种相关特征集合,从该语种相关特征集合的集合相关语种向量中,查找所述修正语种候选集合中的各语种对应的语种关联度系数,如果至少一个所查找的语种关联度系数不为零,则从所述查找结果中选择最大语种关联度系数对应的语种,作为所述目标对象使用的语种,结束所述遍历;否则,继续所述遍历。5.根据权利要求4所述的方法,其特征在于,所述语种关联度等级按照预设的语种关联度等级划分策略设置;所述语种关联度等级划分策略包括:如果所述对象为与所述智能设备的交互对象或所述交互对象的私人物品,则所述对象的语种关联度等级为高级;如果所述对象为除所述交互对象之外的其他人或所述...

【专利技术属性】
技术研发人员:谢志栋王琨丁琳周进华孙宇
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1