训练样本筛选方法及电子设备技术

技术编号:25311529 阅读:40 留言:0更新日期:2020-08-18 22:29
本发明专利技术提供一种训练样本筛选方法及电子设备,所述方法包括:将训练样本集输入用于设置标签的第一网络模型,得到所述训练样本集对应的至少一个标签,所述训练样本集包括至少两个语音样本,所述至少一个标签中每个标签分别对应所述至少两个语音样本的一帧语音信号或多帧连续的语音信号;分别确定所述至少一个标签中每个标签对应的语音信号的时长;基于所述至少一个标签中每个标签对应的语音信号的时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集。本发明专利技术实施例能够提高训练的模型的准确性。

【技术实现步骤摘要】
训练样本筛选方法及电子设备
本专利技术涉及语音处理
,尤其涉及一种训练样本筛选方法及电子设备。
技术介绍
自然语言是指通过自然进化产生的人类之间用于交流的语言。自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理技术可以基于网络模型对语音进行处理,满足各个使用场景的需求,例如,在语音识别使用场景,可以基于声学模型、语言模型及解码器将语音处理为文字。在基于网络模型对语音处理之前,需要采用训练样本对模型进行训练。在对模型进行训练的过程中,将训练样本按帧输入网络模型,并基于输入的至少一帧语音对应的目标输出更新网络模型的参数。当训练样本中存在脏数据时,会无法准确地确定目标输出,从而导致训练的模型的准确性较低。
技术实现思路
本专利技术实施例提供一种训练样本筛选方法及电子设备,以解决现有技术中当训练样本中存在脏数据时,会无法准确地确定目标输出,从而导致训练的模型的准确性较低的问题。为了解决上述技术问题本文档来自技高网...

【技术保护点】
1.一种训练样本筛选方法,其特征在于,所述方法包括:/n将训练样本集输入用于设置标签的第一网络模型,得到所述训练样本集对应的至少一个标签,所述训练样本集包括至少两个语音样本,所述至少一个标签中每个标签分别对应所述至少两个语音样本的一帧语音信号或多帧连续的语音信号;/n分别确定所述至少一个标签中每个标签对应的语音信号的时长;/n基于所述至少一个标签中每个标签对应的语音信号的时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集。/n

【技术特征摘要】
1.一种训练样本筛选方法,其特征在于,所述方法包括:
将训练样本集输入用于设置标签的第一网络模型,得到所述训练样本集对应的至少一个标签,所述训练样本集包括至少两个语音样本,所述至少一个标签中每个标签分别对应所述至少两个语音样本的一帧语音信号或多帧连续的语音信号;
分别确定所述至少一个标签中每个标签对应的语音信号的时长;
基于所述至少一个标签中每个标签对应的语音信号的时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集。


2.根据权利要求1所述的方法,其特征在于,所述至少一个标签包括K种不同的标签,K为正整数,所述基于所述至少一个标签中每个标签对应的语音信号的时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集,包括:
基于所述至少一个标签中每个标签对应的语音信号的时长,分别计算所述K种标签中每种标签对应的语音信号的平均时长;
基于所述K种标签中每种标签对应的语音信号的平均时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集。


3.根据权利要求2所述的方法,其特征在于,所述基于所述K种标签中每种标签对应的语音信号的平均时长,对所述训练样本集中的语音样本进行筛选,得到筛选后的训练样本集,包括:
若所述至少一个标签中存在目标标签,则从所述训练样本集中删除所述目标标签对应的语音信号所属的语音样本;
其中,所述目标标签对应的语音信号的时长大于第一阈值,或者,所述目标标签对应的语音信号的时长小于第二阈值,所述第一阈值为第一预设系数与所述目标标签所属种类的标签对应的语音信号的平均时长的乘积,所述第二阈值为第二预设系数与所述目标标签所属种类的标签对应的语音信号的平均时长的乘积,所述第一预设系数大于所述第二预设系数。


4.根据权利要求1所述的方法,其特征在于,所述至少一个标签包括静音标签和非静音标签,所述方法还包括:
将所述筛选后的训练样本集中的语音样本输入用于人声识别的第二网络模型,得到人声语音段;
基于所述人声语音段与所述非静音标签对应的语音信号对所述筛选后的训练样本集中的语音样本进行筛选。


5.根据权利要求4所述的方法,其特征在于,所述基于所述人声语音段与所述非静音标签对应的语音信号对所述筛选后的训练样本集中的语音样本进行筛选,包括:
若所述人声语音段中第一帧语音信号与第一标签对应的语音信号中的第一帧语音信号之间存在N帧语音信号,则从所述筛选后的训练样本集中删除所述人声语音段所属的语音样本,所述第一标签为所述人声语音段对应的非静音标签,N大于第一预设值;
或者,若所述人声语音段中最后一帧语音信号与所述第一标签对应的语音信号中的最后一帧语音信号之间存在M帧语音信号,则从所述筛选后的训练样本集中删除所述人声语音段所属的语音样本,M大于第二预设值。


6.一种电子设备,...

【专利技术属性】
技术研发人员:许孝先冯大航陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1