模型训练方法、信息识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26171156 阅读:27 留言:0更新日期:2020-10-31 13:42
本申请公开了模型训练方法、信息识别方法、装置、电子设备及存储介质,涉及深度学习技术领域。具体实现方案为:获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一文本的文本质量的标注信息;利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型。通过采用第一样本对基础网络模型进行训练,获得用于进行文本质量识别的目标网络模型,这样,可采用目标网络模型对文本信息进行审核,来识别文本信息的质量,提高识别效率。

【技术实现步骤摘要】
模型训练方法、信息识别方法、装置、电子设备及存储介质
本申请涉及数据处理
中的深度学习技术,尤其涉及一种模型训练方法、信息识别方法、装置、电子设备及存储介质。
技术介绍
随着技术的发展,越来越多的人通过搜索工具进行信息查询。例如,搜索论文,搜索商品相关信息,搜索医疗信息等等。由于已有的信息库包括大量的文本信息,文本信息的质量参差不齐,需要根据文本内容来对文本信息进行质量识别,例如,通过人工审核的方式对信息库内的文本信息进行审核,人工判定质量好坏。
技术实现思路
本公开提供了一种模型训练方法、信息识别方法、装置、电子设备及存储介质。根据本公开的第一方面,提供了一种模型训练方法,包括:获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一文本的文本质量的标注信息;利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型。根据本公开的第二方面,提供了一种模型训练装置,包括:获取模块,用于获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一本文档来自技高网...

【技术保护点】
1.一种模型训练方法,包括:/n获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一文本的文本质量的标注信息;/n利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型。/n

【技术特征摘要】
1.一种模型训练方法,包括:
获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一文本的文本质量的标注信息;
利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型。


2.根据权利要求1所述的方法,其中,所述利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型,包括:
利用所述第一样本对基础网络模型进行训练,获得中间网络模型;
采用所述中间网络模型对第二样本进行预测,获得所述第二样本的文本质量的预测结果;
若所述预测结果满足预设条件,则采用所述第一样本和所述第二样本对所述基础网络模型进行训练,获得目标网络模型。


3.根据权利要求2所述的方法,其中,所述预测结果包括至少两个预测值,以及所述至少两个预测值中各预测值的概率;
所述预设条件为第一预测值的概率与第二预测值的概率之差的绝对值小于预设阈值,所述至少两个预测值包括所述第一预测值和所述第二预测值,其中,所述第一预测值的概率为所述预测结果中的最大概率。


4.根据权利要求1所述的方法,其中,所述特征信息包括段落的元素间关系特征和元素内在特征;
其中,所述元素间关系特征根据如下关系中的至少一项确定:
所述第一文本的标题和所述段落的标题之间的关系;
所述第一文本的标题和所述段落之间的关系;
所述段落与所述第一文本的其他段落之间的关系;
所述元素内在特征包括结构特征和文本特征;
其中,所述结构特征包括所述段落的组织形式和关键信息,所述文本特征包括所述第一文本的标题的质量和所述段落的文本的质量。


5.根据权利要求4所述的方法,其中,所述结构特征通过对所述段落利用预设规则获得;
对于所述特征信息中除所述结构特征之外的第一特征,采用特征抽取模型对所述第一文本进行抽取获得,所述特征抽取模型采用标注的第三样本对基础抽取模型进行训练获得;
其中,每个第一特征对应一个特征抽取模型。


6.一种模型训练装置,包括:
获取模块,用于获取第一样本,所述第一样本包括第一文本的段落的特征信息,以及所述第一文本的文本质量的标注信息;
训练模块,用于利用第一样本对基础网络模型进行训练,获取用于进行文本质量识别的目标网络模型。


7.根据权利要求6所述的装置,其中,所述训练模块,包括:
第一获取子模块,用于利用所述第一样本对基础...

【专利技术属性】
技术研发人员:白亚楠刘子航林荣逸欧阳宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1