模型自适应重训方法、装置、电子设备和存储介质制造方法及图纸

技术编号：25915048 阅读：29 留言：0更新日期：2020-10-13 10:33

本申请公开了模型自适应重训方法、装置、电子设备以及存储介质，涉及人工智能、知识图谱和大数据技术领域。具体实现方案为：获取用户标注样本；将用户标注样本与原有样本进行合并；在合并后的样本满足样本训练条件的情况下，采用合并后的样本对基础模型进行重训，得到增量模型；其中，基础模型为采用原有样本训练得到的问答模型。本申请实施例提出的模型重训方法能够达到较好的效果，且能够降低开发成本和时间成本。

全部详细技术资料下载

【技术实现步骤摘要】
模型自适应重训方法、装置、电子设备和存储介质
本申请涉及人工智能领域，尤其涉及知识图谱和大数据
具体地，本申请提供一种模型自适应重训方法、装置、电子设备和存储介质。
技术介绍
知识图谱的应用使得人工智能得到更好的发展，使人们通过搜索能够找到最想要的信息。知识图谱本质上是语义网络，是一种基于图的数据结构，描述的是真实世界汇总存在的实体以及实体之间的关系。领域问答的基础在于领域知识图谱。领域问答模型(QA)采用大量的问答语料进行训练，给定问答对及对应的标签，采用问答对及对应的标签对问答模型进行训练。对于模型调优方案，通常是使用领域数据对模型进行微调，并需要进行阈值调优，以达到更好效果。这类型的方案需要较高开发成本；针对不同场景，数据微调策略也有所不同，不可轻易扩展到更多场景中，得到领域模型的耗时也相对较高。
技术实现思路
本申请提供了一种模型自适应重训方法、装置、电子设备以及存储介质。根据本申请的一方面，提供了一种模型自适应重训方法，包括：获取用户标注样本；将所述用户标注样本与原有样本进行合并；在合并后的样本满足样本训练条件的情况下，采用所述合并后的样本对基础模型进行重训，得到增量模型；其中，所述基础模型为采用所述原有样本训练得到的问答模型。根据本申请的另一方面，提供了一种模型自适应重训装置，包括：获取模块，用于获取用户标注样本；合并模块，用于将所述用户标注样本与原有样本进行合并；重训模块，用于在合并后的样本满足样本训练条...

【技术保护点】
1.一种模型自适应重训方法，包括：/n获取用户标注样本；/n将所述用户标注样本与原有样本进行合并；/n在合并后的样本满足样本训练条件的情况下，采用所述合并后的样本对基础模型进行重训，得到增量模型；其中，所述基础模型为采用所述原有样本训练得到的问答模型。/n

【技术特征摘要】
1.一种模型自适应重训方法，包括：
获取用户标注样本；
将所述用户标注样本与原有样本进行合并；
在合并后的样本满足样本训练条件的情况下，采用所述合并后的样本对基础模型进行重训，得到增量模型；其中，所述基础模型为采用所述原有样本训练得到的问答模型。

2.根据权利要求1所述的方法，还包括：
在所述增量模型相对于所述基础模型的效果提升程度达到预设阈值的情况下，采用所述增量模型和所述基础模型执行智能问答。

3.根据权利要求1或2所述的方法，其中，所述获取用户标注样本，包括：
获取用户对所述基础模型提供的问答结果的标注信息；
根据所述标注信息获取所述用户标注样本，所述用户标注样本包括包含正确答案的正样本和/或包含错误答案的负样本。

4.根据权利要求1或2所述的方法，其中，所述合并后的样本满足样本训练条件，包括：
所述合并后的样本的数据量、样本比例及数据分布中的至少一项满足对应的预设条件。

5.根据权利要求1或2所述的方法，其中，所述采用所述合并后的样本对基础模型进行重训，包括：
采用所述合并后的样本，利用焦点损失FocalLoss技术和/或累积边缘Sigmoid技术对基础模型进行重训。

6.一种模型自适应重训装置，包括：
获取模块，用于获取用户标注样本；
合并模块，用于将所述用户标注样本与原有样本进行合并；
重训模块，用于在合并后的样本满足样本训练条件的情况下，采用所述合并后的样本对基础模型进行重训，得到增量模型；其中，...

【专利技术属性】
技术研发人员：谢炜坚，黄强，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人