模型训练方法、信息提取方法、相关装置及存储介质制造方法及图纸

技术编号:30093153 阅读:18 留言:0更新日期:2021-09-18 08:55
本申请提供了一种模型训练方法、信息提取方法、相关装置及存储介质。模型训练方法包括:获取N个样本数据;每个样本数据包括M种类别的子数据;N个样本数据对应M

【技术实现步骤摘要】
模型训练方法、信息提取方法、相关装置及存储介质


[0001]本申请涉及计算机
,尤其涉及一种模型训练方法、信息提取方法、相关装置及存储介质。

技术介绍

[0002]目前互联网的普及率越来越高,网民数量也不断增加,越来越多的人通过视频等多模态数据来记录并且分享生活。在创作短视频过程中不仅需要准备视频内容、音频内容以及文字,而且还需要考虑如何生成高质量的文案或标题吸引更多的用户观看。目前的文案生成方法主要是通过人工编写等方式生成,通常会导致生成的文案质量低、生成效率低等问题。

技术实现思路

[0003]本申请实施例提供了一种模型训练方法、信息提取方法、相关装置及存储介质,可以快速准确地提取目标信息。
[0004]为解决以上技术问题,本申请包括以下技术方案:
[0005]第一方面,本申请实施例提供了一种模型训练方法,所述方法包括:
[0006]获取N个样本数据;每个所述样本数据包括M种类别的子数据;其中,N个所述样本数据包括的所述M种类别的子数据对应M
×
N个子数据对,每个所述子数据对包括M个子数据,每个所述子数据所属的类别不同,每个子数据对包括的M个子数据之间对应一个关联关系,每个所述样本数据包括的M种类别的子数据相互关联,所述M和N均为大于或等于2的正整数;
[0007]将所述M
×
N个子数据对输入到预设模型中进行训练,生成每种类别的子数据各自对应的预训练模型;其中,所述预设模型用于计算每个子数据对包括的M个子数据之间的相似度,并根据所述M
×
N个子数据对各自包括的M个子数据之间的相似度确定每一种数据类别各自对应的向量表示空间。
[0008]第二方面,本申请实施例提供了一种信息提取方法,所述方法包括:
[0009]获取待处理数据,所述待处理数据包括至少一种类别的待处理子数据;
[0010]将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中,得到所述待处理数据对应的向量信息;其中,所述预训练模型为采用权利要求1所述的模型训练方法得到的预训练模型;
[0011]根据所述向量信息提取所述待处理数据携带的目标信息。
[0012]第三方面,本申请实施例提供了一种模型训练装置,所述装置包括:
[0013]第一获取模块,用于获取N个样本数据;每个所述样本数据包括M种类别的子数据;其中,N个所述样本数据包括的所述M种类别的子数据对应M
×
N个子数据对,每个所述子数据对包括M个子数据,每个所述子数据所属的类别不同,每个子数据对包括的M个子数据之间对应一个关联关系,每个所述样本数据包括的M种类别的子数据相互关联,所述M和N均为
大于或等于2的正整数;
[0014]训练模块,用于将所述M
×
N个子数据对输入到预设模型中进行训练,生成每种类别的子数据各自对应的预训练模型;其中,所述预设模型用于计算每个子数据对包括的M个子数据之间的相似度,并根据所述M
×
N个子数据对各自包括的M个子数据之间的相似度确定每一种数据类别各自对应的向量表示空间。
[0015]第四方面,本申请实施例提供了一种信息提取装置,所述装置包括:
[0016]第二获取模块,用于获取待处理数据,所述待处理数据包括至少一种类别的待处理子数据;
[0017]输出模块,用于将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中,得到所述待处理数据对应的向量信息;其中,所述预训练模型为采用权利要求1所述的模型训练方法得到的预训练模型;
[0018]提取模块,用于根据所述向量信息提取所述待处理数据携带的目标信息。
[0019]第五方面,本申请提供了另一种模型训练装置,所述装置包括处理器、存储器以及通信接口:
[0020]所述处理器与所述存储器、所述通信接口相连;
[0021]所述存储器,用于存储可执行程序代码;
[0022]所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如上述第一方面所述的模型训练方法。
[0023]第六方面,本申请提供了另一种信息提取装置,所述装置包括处理器、存储器以及通信接口:
[0024]所述处理器与所述存储器、所述通信接口相连;
[0025]所述存储器,用于存储可执行程序代码;
[0026]所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如上述第二方面所述的信息提取方法。
[0027]第七方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述第一方面所述的模型训练方法或第二方面所述的信息提取方法。
[0028]本申请实施例通过大量的包含多种类别的子数据的样本数据对预设模型进行训练,生成每一种类别的子数据对应的预训练模型,在用户使用过程中,将原始数据输入到预训练模型中,获取原始数据对应的向量信息,最后通过预设的信息提取模型提取原始数据对应的目标信息。采用本申请提供的模型训练方法,利用对比学习的思想来构建预训练模型,生成多种不同类别的原始数据各自对应的向量信息,获得了对原始数据更加准确简短的表示方法,再根据获取的向量信息提取目标信息,使得提取的目标信息质量更高,实现了从原始数据中快速准确地提取目标信息,解决了现有的通过人工编写等方式提取的信息导致提取的信息质量低、生成效率低等问题。
附图说明
[0029]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1是本申请实施例提供的一种应用场景示意图;
[0031]图2是本申请实施例提供的一种模型训练方法的流程示意图;
[0032]图3是本申请实施例提供的一种子数据对的构建方法示意图;
[0033]图4是本申请实施例提供的一种双塔模型的向量表示空间示意图;
[0034]图5是本申请实施例提供的一种编码器的结构示意图;
[0035]图6是本申请实施例提供的一种信息提取方法的流程示意图;
[0036]图7是本申请实施例提供的一种解码器的结构示意图;
[0037]图8是本申请实施例提供的一种基于预训练模型提取信息方法的整体框架示意图;
[0038]图9是本申请实施例提供的一种电子设备在提取信息过程中界面显示示意图;
[0039]图10是本申请实施例提供的另一种信息提取方法的流程示意图;
[0040]图11是本申请实施例提供的另一种信息提取方法的流程示意图;
[0041]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取N个样本数据;每个所述样本数据包括M种类别的子数据;其中,N个所述样本数据包括的所述M种类别的子数据对应M
×
N个子数据对,每个所述子数据对包括M个子数据,每个所述子数据所属的类别不同,每个子数据对包括的M个子数据之间对应一个关联关系,每个所述样本数据包括的M种类别的子数据相互关联,所述M和N均为大于或等于2的正整数;将所述M
×
N个子数据对输入到预设模型中进行训练,生成每种类别的子数据各自对应的预训练模型;其中,所述预设模型用于计算每个子数据对包括的M个子数据之间的相似度,并根据所述M
×
N个子数据对各自包括的M个子数据之间的相似度确定每一种数据类别各自对应的向量表示空间。2.如权利要求1所述的方法,其特征在于,所述将所述M
×
N个子数据对输入到预设模型中进行训练,生成每种类别的子数据各自对应的预训练模型,包括:将所述M
×
N个子数据对输入到预设模型中;根据所述M
×
N个子数据对包括的M个子数据之间的关联关系对所述预设模型进行训练,生成每种类别的子数据各自对应的预训练模型。3.一种信息提取方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括至少一种类别的待处理子数据;将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中,得到所述待处理数据对应的向量信息;其中,所述预训练模型为采用权利要求1所述的模型训练方法得到的预训练模型;根据所述向量信息提取所述待处理数据携带的目标信息。4.如权利要求3所述的方法,其特征在于,所述将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中,得到所述待处理数据对应的向量信息,包括:将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中,得到所述待处理子数据各自对应的向量信息;对所述待处理子数据各自对应的向量信息进行特征融合操作,得到所述待处理数据对应的向量信息;其中,所述特征融合操作包括以下至少一项:拼接操作、池化操作。5.如权利要求3所述的方法,其特征在于,所述根据所述向量信息提取所述待处理数据携带的目标信息,包括:对所述向量信息进行正则化处理;根据处理后的向量信息提取所述待处理数据携带的目标信息。6.如权利要求4所述的方法,其特征在于,所述待处理数据包括至少两种类别的待处理子数据;所述将所述至少一种类别的待处理子数据输入到各个所述待处理子数据的类别各自对应的预训练模型中之后,还包...

【专利技术属性】
技术研发人员:刘曙铭
申请(专利权)人:成都欧珀通信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1