语种确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30016148 阅读:16 留言:0更新日期:2021-09-11 06:24
本公开提供了一种语种确定方法、装置、电子设备及存储介质。通过响应于收到目标用户的语音数据,获取所述目标用户的常用语种集合;基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务;响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种。从而实现了在调用语种识别服务之前进行备选语种的确定,提高识别效率并降低了语种识别服务的资源成本。效率并降低了语种识别服务的资源成本。效率并降低了语种识别服务的资源成本。

【技术实现步骤摘要】
语种确定方法、装置、电子设备及存储介质


[0001]本公开的实施例涉及信息处理
,尤其涉及一种语种确定方法、装置、电子设备及存储介质。

技术介绍

[0002]语种识别(Language Identification,LID)技术被广泛应用于音视频领域,主要目的是通过音频识别对应的语种,为后续处理如自动语音识别(automatic speech recognition,ASR)做准备。目前在互联网音视频会议场景中,LID作为一个通用技术,在面对音视频会议场景时的识别准确率并不理想。对于多语种场景,LID识别的备选语种通常包括中、英、日等多种语种。
[0003]目前语种识别作为单独的识别模块,准确率并不能达到100%,尤其是随着备选语种的增加,准确率大幅降低。同时,如果要持续地进行语种识别,会消耗大量的硬件资源,提高服务成本。

技术实现思路

[0004]本公开的实施例提出了一种语种确定方法、装置、电子设备及存储介质。
[0005]第一方面,本公开的实施例提供了一种语种确定方法,该方法包括:响应于收到目标用户的语音数据,获取所述目标用户的常用语种集合;基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务;响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种。
[0006]在一些可选的实施方式中,所述基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务,包括:
[0007]响应于所述常用语种集合中的语种数量不超过预设阈值,确定不调用所述语种识别服务。
[0008]在一些可选的实施方式中,所述基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务,包括:
[0009]响应于所述常用语种集合中的语种数量大于预设阈值,调用所述语种识别服务;
[0010]所述响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种,包括:
[0011]将所述常用语种集合所包含的语种作为所述语音数据的候选语种,基于所述语种识别服务,从所述候选语种中确定出所述目标语种。
[0012]在一些可选的实施方式中,所述方法还包括:
[0013]根据确定的目标语种对所述语音数据进行语音识别。
[0014]在一些可选的实施方式中,所述目标用户的常用语种集合通过以下常用语种确定步骤得到:
[0015]获取所述目标用户的历史语种识别统计数据;
[0016]基于所述历史语种识别统计数据确定所述目标用户的常用语种集合。
[0017]在一些可选的实施方式中,所述历史语种识别统计数据,包括:
[0018]进行语种识别的总次数、识别出的语种及对应每种语种的识别次数。
[0019]在一些可选的实施方式中,所述基于所述历史语种识别统计数据确定所述目标用户的常用语种集合,包括:
[0020]将识别次数在所述总次数中占比大于预设比例阈值的语种确定为所述常用语种集合中的语种。
[0021]在一些可选的实施方式中,所述基于所述历史语种识别统计数据确定所述目标用户的常用语种集合,包括:
[0022]将识别次数在预设识别次数阈值以上的语种确定为所述常用语种集合中的语种。
[0023]在一些可选的实施方式中,所述获取所述目标用户的历史语种识别统计数据,包括:
[0024]获取所述目标用户参与的预设会议次数阈值以上次会议对应的所述历史语种识别统计数据。
[0025]在一些可选的实施方式中,所述获取所述目标用户的历史语种识别统计数据,包括:
[0026]获取所述目标用户标识对应的历史语种识别数据;
[0027]对与所述目标用户标识对应的历史语种识别数据进行脱敏处理;
[0028]对所述脱敏处理后的历史语种识别数据进行统计,得到所述历史语种识别统计数据。
[0029]在一些可选的实施方式中,所述历史语种识别数据包括:
[0030]用户标识、会议标识、语种检测序列及对应每次语种检测的时间戳。
[0031]第二方面,本公开的实施例提供了一种语种确定装置,该装置包括:
[0032]获取单元,被配置成响应于收到目标用户的语音数据,获取所述目标用户的常用语种集合;
[0033]处理单元,被配置成基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务;
[0034]配置单元,被配置成响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种。
[0035]在一些可选的实施方式中,所述处理单元,被具体配置成:
[0036]响应于所述常用语种集合中的语种数量不超过预设阈值,确定不调用所述语种识别服务。
[0037]在一些可选的实施方式中,所述处理单元,被具体配置成:
[0038]响应于所述常用语种集合中的语种数量大于预设阈值,调用所述语种识别服务;
[0039]所述配置单元,被具体配置成:
[0040]将所述常用语种集合所包含的语种作为所述语音数据的候选语种,基于所述语种识别服务,从所述候选语种中确定出所述目标语种。
[0041]在一些可选的实施方式中,所述装置还包括:
[0042]语种识别单元,被配置成根据确定的目标语种对所述语音数据进行语音识别。
[0043]在一些可选的实施方式中,为得到所述目标用户的常用语种集合,所述处理单元被配置成执行以下常用语种确定步骤:
[0044]获取所述目标用户的历史语种识别统计数据;
[0045]基于所述历史语种识别统计数据确定所述目标用户的常用语种集合。
[0046]在一些可选的实施方式中,所述历史语种识别统计数据,包括:
[0047]进行语种识别的总次数、识别出的语种及对应每种语种的识别次数。
[0048]在一些可选的实施方式中,所述处理单元,被具体配置成:
[0049]将识别次数在所述总次数中占比大于预设比例阈值的语种确定为所述常用语种集合中的语种。
[0050]在一些可选的实施方式中,所述处理单元,被具体配置成:
[0051]将识别次数在预设识别次数阈值以上的语种确定为所述常用语种集合中的语种。
[0052]在一些可选的实施方式中,所述获取所述目标用户的历史语种识别统计数据,包括:
[0053]获取所述目标用户参与的预设会议次数阈值以上次会议对应的所述历史语种识别统计数据。
[0054]在一些可选的实施方式中,所述处理单元,被具体配置成:
[0055]获取所述目标用户标识对应的历史语种识别数据;
[0056]对与所述目标用户标识对应的历史语种识别数据进行脱敏处理;
[0057]对所述脱敏处理后的历史语种识别数据进行统计,得到所述历史语种识别统计数据。
[0058]在一些可选的实施方式中,所述历史语种识别数据包括:
[0059]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语种确定方法,包括:响应于收到目标用户的语音数据,获取所述目标用户的常用语种集合;基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务;响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种。2.根据权利要求1所述的方法,其中,所述基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务,包括:响应于所述常用语种集合中的语种数量不超过预设阈值,确定不调用所述语种识别服务。3.根据权利要求1所述的方法,其中,所述基于所述常用语种集合所包含的常用语种的数量确定是否调用语种识别服务,包括:响应于所述常用语种集合中的语种数量大于预设阈值,调用所述语种识别服务;所述响应于确定调用所述语种识别服务,基于所述语种识别服务确定所述语音数据的目标语种,包括:将所述常用语种集合所包含的语种作为所述语音数据的候选语种,基于所述语种识别服务,从所述候选语种中确定出所述目标语种。4.根据权利要求1至3任一项所述的方法,其中,所述方法还包括:根据确定的目标语种对所述语音数据进行语音识别。5.根据权利要求1所述的方法,其中,所述目标用户的常用语种集合通过以下常用语种确定步骤得到:获取所述目标用户的历史语种识别统计数据;基于所述历史语种识别统计数据确定所述目标用户的常用语种集合。6.根据权利要求5所述的方法,其中,所述历史语种识别统计数据,包括:进行语种识别的总次数、识别出的语种及对应每种语种的识别次数。7.根据权利要求6所述的方法,其中,所述基于所述历史语种识别统计数据确定所述目标用户的常用语种集合,包括:将识别次数在所述总次数中占比大于预设比例阈值的语种确定为所...

【专利技术属性】
技术研发人员:苗天时赵立杨晶生
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1