一种语种识别方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:38161669 阅读:10 留言:0更新日期:2023-07-13 09:34
本申请实施例提供了一种语种识别方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过语种识别模型对待识别语音信息进行语种识别,得到待识别语音信息的语种识别结果,并且用于对该语种识别模型进行训练的训练语音样本,通过对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到,可进一步对该语种识别模型进行训练的训练语音样本进行大规模的数据扩充,识别语种和社交语种一致的目标用户的音频数据在多语种场景下的语种置信度更高,训练语音样本的可靠性更高,训练语音的内容更多样,训练得到的语种识别模型在复杂语种环境下的识别精度更高,有效提高在复杂的多语种场景下语种识别准确度。在复杂的多语种场景下语种识别准确度。在复杂的多语种场景下语种识别准确度。

【技术实现步骤摘要】
一种语种识别方法、装置、设备、存储介质及产品


[0001]本申请实施例涉及音频处理
,尤其涉及一种语种识别方法、装置、设备、存储介质及产品。

技术介绍

[0002]随着音频处理技术和互联网技术的发展,用户对社交平台的个性化精准推荐、内容精准识别及理解等需求也提出了更高的要求。对于有多语种用户群体的社交平台,用户内容的识别、理解和推荐有着更大的挑战,复杂的多语种场景需要先解决语种识别问题,才能更好地进行内容识别、理解及推荐。因此语种识别对个性化精准语种的推荐下发有着不可缺少的地位,同时也是其他内容识别和理解技术落地和性能提升的基础。
[0003]对于语种较为单一的国家或地区,语音的语种可以直接通过IP地址或者国家码确认,而对于语种类型较为复杂的国家或地区,在同一个国家或地区中会同时存在大量使用不同语种的用户的情况,此时通过IP地址或者国家码难以确定准确的语音语种,语种识别准确度较低。

技术实现思路

[0004]本申请实施例提供一种语种识别方法、装置、设备、存储介质及产品,以解决相关技术在复杂的多语种场景下语种识别准确度较低的技术问题,有效提高在复杂的多语种场景下语种识别准确度。
[0005]在第一方面,本申请实施例提供了一种语种识别方法,包括:
[0006]获取待识别用户的待识别语音信息;
[0007]将所述待识别语音信息输入至训练完成的语种识别模型,通过所述语种识别模型对所述待识别语音信息进行语种识别,得到所述待识别用户对应的语种识别结果,所述语种识别模型通过预先收集的训练语音样本进行训练得到,所述训练语音样本通过对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到。
[0008]在第二方面,本申请实施例提供了一种语种识别装置,包括语音获取模块和语种识别模块,其中:
[0009]所述语音获取模块,配置为获取待识别用户的待识别语音信息;
[0010]所述语种识别模块,配置为将所述待识别语音信息输入至训练完成的语种识别模型,通过所述语种识别模型对所述待识别语音信息进行语种识别,得到所述待识别用户对应的语种识别结果,所述语种识别模型通过预先收集的训练语音样本进行训练得到,所述训练语音样本通过对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到。
[0011]在第三方面,本申请实施例提供了一种语种识别设备,包括:存储器以及一个或多个处理器;
[0012]所述存储器,用于存储一个或多个程序;
[0013]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的语种识别方法。
[0014]在第四方面,本申请实施例提供了一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的语种识别方法。
[0015]在第五方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序,使得设备执行如第一方面所述的语种识别方法。
[0016]本申请实施例通过语种识别模型对待识别语音信息进行语种识别,得到待识别语音信息的语种识别结果,并且用于对该语种识别模型进行训练的训练语音样本,通过对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到,可进一步对该语种识别模型进行训练的训练语音样本进行大规模的数据扩充,识别语种和社交语种一致的目标用户的音频数据在多语种场景下的语种置信度更高,训练语音样本的可靠性更高,训练语音的内容更多样,训练得到的语种识别模型在复杂语种环境下的识别精度更高,有效提高在复杂的多语种场景下语种识别准确度。
附图说明
[0017]图1是本申请实施例提供的一种语种识别方法的流程图;
[0018]图2是本申请实施例提供的一种训练语音样本收集流程示意图;
[0019]图3是本申请实施例提供的一种识别语种标签确定流程示意图;
[0020]图4是本申请实施例提供的一种社交语种标签确定流程示意图;
[0021]图5是本申请实施例提供的一种语种识别装置的结构示意图;
[0022]图6是本申请实施例提供的一种语种识别设备的结构示意图。
具体实施方式
[0023]为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时上述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。上述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0024]本申请提供的语种识别方法可应用于语种识别场景,例如对用户提供的待识别语音信息进行语种识别,并且可基于语种识别结果进行推荐下发、内容审核、内容识别与理解等,旨在通过利用对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到的大规模训练语音样本训练语种识别模型,可通过训练好的语种识别模型实现在复杂的多语种场景下的准确语种识别。对于传统的语种识别方案,一般是根据电子设备的IP地址或者国家码进行确认的,但是对于语种类型较为复杂的国家或地区,仅仅通过IP地址或者国
家码难以确定准确的语音语种。为了提高语种识别准确率,可通过训练语种识别模型(例如深度学习模型)来进行语种识别,然而每个成熟的语种系统都有着数量巨大的词汇和复杂的语法,而且不同语种之间的词汇和语法都有着较大的差异,即便是同个语种,不同地区的人也有着不同的口音和方言,另外在真实社交聊天场景里,还需要面临各种环境因素的干扰,导致复杂的多语种场景下的难以实现准确的语种识别,需要大量语音语种训练语料来训练一个高精度的语种识别模型。目前语种公开数据集方面,大部分来自电视节目或者正式的演讲稿,与聊天场景有着明显场景差异,公开数据集在复杂语种环境的置信度较低,直接使用公开数据集进行模型训练容易导致语种识别模型在真实社交聊天场景效果较差。另外,可以直接在业务场景上采集和标注音频,但是直接标注业务场景数据的方式由于昂贵的标注成本限制了标注数据量,限制了语种识别模型的识别精度。基于此,提供本申请实施例的一种语种识别方法,以解决现有语种识别方案在复杂的多语种场景下语种识别准确度较低,模型训练数据置信度较低,而大量的音频采集批注操作工作效率低下的技术问题。
[0025]图1给出了本申请实施例提供的一种语种识别方法的流程图,本申请实施例提供的语种识别方法可以由语种识别装置来执行,该语种识别装置可以通过硬件和/或软件的方式实现,并集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语种识别方法,其特征在于,包括:获取待识别用户的待识别语音信息;将所述待识别语音信息输入至训练完成的语种识别模型,通过所述语种识别模型对所述待识别语音信息进行语种识别,得到所述待识别用户对应的语种识别结果,所述语种识别模型通过预先收集的训练语音样本进行训练得到,所述训练语音样本通过对识别语种标签和社交语种标签一致的目标用户进行语音数据收集得到。2.根据权利要求1所述的语种识别方法,其特征在于,所述训练语音样本的收集步骤包括:获取多个样本用户的初始语音样本,并基于所述初始语音样本确定各个所述样本用户的识别语种标签;获取各个所述样本用户的社交关系信息,并基于所述社交关系信息确定各个所述样本用户的社交语种标签;基于所述识别语种标签和所述社交语种标签对所述样本用户进行筛选,得到多个目标用户;对各个所述目标用户进行语音数据收集得到训练语音样本。3.根据权利要求2所述的语种识别方法,其特征在于,所述基于所述识别语种标签和所述社交语种标签对所述样本用户进行筛选,得到多个目标用户,包括:将所述识别语种标签和所述社交语种标签一致的所述样本用户筛选为目标用户。4.根据权利要求2所述的语种识别方法,其特征在于,所述基于所述初始语音样本确定各个所述样本用户的识别语种标签,包括:基于所述初始语音样本确定各个所述样本用户的设备语种标签、用户语种标签和地区语种标签中的一种或多种的组合,其中,所述用户语种标签基于待训练的语种识别模型对所述初始语音样本进行语种识别得到;基于所述设备语种标签、所述用户语种标签和所述地区语种标签中的一种或多种的组合,确定各个所述样本用户的识别语种标签。5.根据权利要求4所述的语种识别方法,其特征在于,所述基于所述设备语种标签、所述用户语种标签和所述地区语种标签中的一种或多种的组合,确定各个所述样本用户的识别语种标签,包括:按照设定的标签类型优先级,从所述设备语种标签、所述用户语种标签和所述地区语...

【专利技术属性】
技术研发人员:王俊东
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1