语种识别方法和装置制造方法及图纸

技术编号：36954485 阅读：65 留言：0更新日期：2023-03-22 19:14

本申请公开了一种语种识别方法和装置，其中方法包括：当智能设备需要对与其进行语音交互的目标对象进行语种识别时，基于所述目标对象的语音信号，利用预先训练的语种预测模型进行语种预测；基于所述语种预测模型的输出结果和预设的置信度差值阈值，确定是否需要对所述语种预测模型的输出结果进行修正；如果需要进行所述修正，则基于当前环境中的语种相关特征，对所述输出结果进行优化，得到所述目标对象使用的语种，否则，选择所述输出结果中置信度最大的语种，作为所述目标对象使用的语种。本申请通过基于环境中的语种相关特征，对语种预测模型的输出结果进行修正，可以提高基于语音进行语种识别的准确度。音进行语种识别的准确度。音进行语种识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
语种识别方法和装置

[0001]本专利技术涉及人工智能技术，特别是涉及一种语种识别方法和装置。

技术介绍

[0002]语种识别是根据输入的文本和语音识别该文本和语音对应的语言(即语种)。目前基于文本的语种识别比较简单成熟。但是，基于语音的语种识别技术还不是很成熟。在商用系统中仍然还是通过手动设置语言。这种手动设置的方式不能有效适应交互语言多变的场合。
[0003]语种识别技术可以帮助语音助手解析用户的语音交互内容，并根据内容提供进一步的服务。语种识别的精度对语音识别有着较为重要的影响，准确的语种识别可以提升系统对多语音交互内容分析的准确性，进而可以为用户提供更优质的语音交互体验。尤其是，准确的语种识别结果可以成为公共设备为不同语种用户的服务基础，并可以针对用户个人使用的语种，提供差异性的服务。
[0004]专利技术人在实现本申请的过程中发现：现有的基于语音的语种识别技术无法提供准确、可靠的语种识别结果。具体原因为：现有方案主要是利用预先训练的语音预测模型进行语种识别。但是，语音预测模型并不能确保所输出的语种分析结果具有高区分度，这样，就无法基于语音预测模型的输出结果，做出准确的语种设置，从而无法确保应用系统对语音交互内容的准确分析，进而无法为用户提供可靠的语音交互服务。

技术实现思路

[0005]有鉴于此，本专利技术的主要目的在于提供一种语种识别方法和装置，可以提高基于语音进行语种识别的准确度。
[0006]为了达到上述目的，本专利技术实施例提出的技术方案为：
[000...

【技术保护点】

【技术特征摘要】
1.一种语种识别方法，其特征在于，包括：当智能设备需要对与其进行语音交互的目标对象进行语种识别时，基于所述目标对象的语音信号，利用预先训练的语种预测模型进行语种预测；基于所述语种预测模型的输出结果和预设的置信度差值阈值，确定是否需要对所述语种预测模型的输出结果进行修正；如果需要进行所述修正，则基于当前环境中的语种相关特征，对所述输出结果进行优化，得到所述目标对象使用的语种，否则，选择所述输出结果中置信度最大的语种，作为所述目标对象使用的语种。2.根据权利要求1所述的方法，其特征在于，所述确定是否需要对所述语种预测模型的输出结果进行修正包括：如果第一语种序列中的首个语种和第二个语种的置信度差值不大于所述置信度差值阈值，则判定需要进行所述修正；其中，所述第一语种序列为按照置信度降序对所述输出结果中的语种排序后的序列。3.根据权利要求1所述的方法，其特征在于，所述基于当前环境中的语种相关特征，对所述输出结果进行优化，得到所述目标对象使用的语种包括：从第一语种序列中提取出候选序列，基于所述候选序列，得到修正语种候选集合；所述第一语种序列为按照置信度降序对所述输出结果中的语种排序后的序列；所述候选序列满足：序列中相邻语种之间的置信度差值小于等于所述置信度差值阈值，且序列的首个语种为所述第一语种序列的首个语种；基于当前环境中的语种相关特征和所述修正语种候选集合，确定所述目标对象使用的语种。4.根据权利要求3所述的方法，其特征在于，所述基于当前环境中的语种相关特征和所述修正语种候选集合，确定所述目标对象使用的语种包括：获取当前环境中每个对象的语种相关特征；按照对象的语种关联度等级，对所有所述对象的所述语种相关特征进行分类，得到每种语种关联度等级对应的语种相关特征集合；对于每个所述语种相关特征集合，确定该语种相关特征集合中每个语种相关特征对应的特征相关语种向量，并基于所有所述特征相关语种向量，生成该语种相关特征集合的集合相关语种向量；其中，所述向量中的每个元素包括语种和相应的语种关联度系数；按照语种关联度等级的降序，依次遍历所述语种相关特征集合，基于所遍历的语种相关特征集合，从该语种相关特征集合的集合相关语种向量中，查找所述修正语种候选集合中的各语种对应的语种关联度系数，如果至少一个所查找的语种关联度系数不为零，则从所述查找结果中选择最大语种关联度系数对应的语种，作为所述目标对象使用的语种，结束所述遍历；否则，继续所述遍历。5.根据权利要求4所述的方法，其特征在于，所述语种关联度等级按照预设的语种关联度等级划分策略设置；所述语种关联度等级划分策略包括：如果所述对象为与所述智能设备的交互对象或所述交互对象的私人物品，则所述对象的语种关联度等级为高级；如果所述对象为除所述交互对象之外的其他人或所述...

【专利技术属性】
技术研发人员：谢志栋，王琨，丁琳，周进华，孙宇，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人