一种模型训练方法、装置、电子设备及其存储介质制造方法及图纸

技术编号:31456230 阅读:26 留言:0更新日期:2021-12-18 11:22
本发明专利技术公开了一种模型训练方法、装置、电子设备及其存储介质。该方法包括:接收预处理后的训练样本;根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式将预置的至少一个卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层;通过训练后的卷积层部署替换对应所述网络层得到训练模型。通过卷积层替换神经网络中的网络层,训练得到由卷积层建构的训练模型,简化神经网络的复杂程度,进而提高工作效率和响应时长的技术问题。时长的技术问题。时长的技术问题。

【技术实现步骤摘要】
一种模型训练方法、装置、电子设备及其存储介质


[0001]本专利技术涉及计算机领域,尤其是指一种模型训练方法、装置、电子设备及其存储介质。

技术介绍

[0002]目前,在很多场景和领域中都可以通过人工智能深度学习的方式代替原有效率更低工作方式,但是在现有技术中仍然存在一些情况,即便采用了现有技术中人工智能深度学习的方式,也会出现相应慢的情况。比如,随着网络信息时代的发展,电商平台各项功能日益完善,很多商家也开始由线下转为线上,现在网上购物已成为我们日常生活的一部分。为了吸引消费者购买商品,很多商家会给商品打一些促销语,这些促销语展现在商品的详情页上。然而很多促销语并不符合电商平台规范,甚至是违反广告法的。如促销语中含有“最新科学”、“最新技术”、“最先进加工工艺”等绝对化的描述,含有“安全”、“无毒副作用”、“无依赖”、“无效退款”、“XX保险公司保险”等承诺性内容。为了提高商品信息的精准度,更好地规范商家发布商品信息的行为,给广大的网络消费者营造一种健康良好的电商平台生态。电商平台会组织专门的审核人员,对商品促销语合规性进行人工检测,对不符合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,该方法包括:接收预处理后的训练样本;根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式,将预置的至少一个卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层;通过训练后的卷积层部署替换对应所述网络层得到训练模型。2.根据权利要求1所述的模型训练方法,其特征在于,所述接收预处理后的训练样本包括:获取待训练的文本训练样本;按预定删除方式删除所述文本训练样本中的非文字字符;对删除所述非文字字符的所述文本训练样本模型添加索引编码和字符向量得到文本向量,其中,所述索引编码用于描述所述文本训练样本中字符的内容,所述字符向量用于描述所述文本训练样本中字符的顺序;对所述文本向量进行归一化处理得到输出向量完成对所述训练样本的预处理。3.根据权利要求2所述的模型训练方法,其特征在于,所述根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式,将预置的卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层包括:将预置的至少一个卷积层与训练模型网络中不同部分的网络层建立对应关系;根据预处理后的所述训练样本通过预置的训练模型网络按照随机替换方式将预置的卷积层替换部分所述训练模型网络中对应的网络层进行训练得到训练后的卷积层。4.根据权利要求3所述的模型训练方法,其特征在于,所述根据预处理后的所述训练样本通过预置的训练模型网络按照随机替换方式,将预置的卷积层替换部分所述训练模型网络中对应的网络层进行训练得到训练后的卷积层包括:创建连续的至少一个数值区间,其中,所述数值区间的个数与所述卷积层的个数相同并与不同的所述卷积层对应;随机生成一个数值,其中,所述数值为属于所述至少一个数值区间的值;选取所述数值属于所述数值区间的对应所述卷积层;将对应的所述卷积层替换对应的所述网络层,并根据预处理后的所述训练样本进行训练得到训练后的卷积层。5.根据权利要求4所述的模型训练方法,其特征在于,所述将...

【专利技术属性】
技术研发人员:李银锋孔滕滕田俊文周彬李晓敏晏梦佳
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1