【技术实现步骤摘要】
本专利技术属于语料识别,具体地涉及对话语料提取方法、系统、计算机及存储介质。
技术介绍
1、视频或语音的对话语料提取对于很多实际的媒体内容领域的问题有重大意义,例如自动生成会议文档记录等。在现有的生成对话文档的方法中会使用到生成模型,但是现有的生成模型都存在缺陷,比如:
2、1.sond:使用resnet34网络与混合网络scn来对说话人的语音进行语音识别与声纹识别。可以使用在确定说话人的说话人日志生成任务中,但是并不包括说话人自动识别训练推理部分,无法进行多说话人识别与语音识别。
3、2.cam++:使用残差卷积网络与时延神经网络对语音进行说话人识别,可以使用在说话人识别任务上,但是并不包括语音识别的训练推理部分,不包括标点预测的训练推理部分,不包括说话人自动识别训练推理部分,无法进行多说话人识别与语音识别。
4、3.paraformer:使用非自回归模型来对语音识别并行地输出全部目标文字,可以使用在语音输入任务上,但是并不包括声纹识别训练推理部分,不包括说话人自动识别训练推理部分,无法进行多说话人
...【技术保护点】
1.一种对话语料提取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对话语料提取方法,其特征在于,所述对所述当前对话数据进行预处理,以得到当前语音数据的步骤包括:
3.根据权利要求1所述的对话语料提取方法,其特征在于,所述单轮非自回归模型的数学模型包括:
4.根据权利要求1所述的对话语料提取方法,其特征在于,所述单轮非自回归模型包括Predictor模块和Sampler模块;
5.根据权利要求1所述的对话语料提取方法,其特征在于,所述时延自注意力机制的公式包括:
6.根据权利要求1所述的对话语料提取
...【技术特征摘要】
1.一种对话语料提取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对话语料提取方法,其特征在于,所述对所述当前对话数据进行预处理,以得到当前语音数据的步骤包括:
3.根据权利要求1所述的对话语料提取方法,其特征在于,所述单轮非自回归模型的数学模型包括:
4.根据权利要求1所述的对话语料提取方法,其特征在于,所述单轮非自回归模型包括predictor模块和sampler模块;
5.根据权利要求1所述的对话语料提取方法,其特征在于,所述时延自注意力机制的公式包括:
6.根据权利要求1所述的对话语料提取方法,其特征在于,...
【专利技术属性】
技术研发人员:郑雨轩,孙春华,甘文靖,陈齐丰,李鸿,章景锋,
申请(专利权)人:江西广播电视网络传媒有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。