短语抽取模型训练、短语抽取方法、装置、设备及介质制造方法及图纸

技术编号:34934577 阅读:66 留言:0更新日期:2022-09-15 07:31
本发明专利技术公开了一种短语抽取模型训练、短语抽取方法、装置、计算机设备及存储介质,该方法通过将训练短语特征输入至特征识别模块中,获取第一概率值,和将训练短语向量输入至短语分类模块中,获取第二概率值;根据第一概率值和第二概率值确定训练短语对应的预测短语标签,根据目标短语标签和预测短语标签确定预测损失值;在预测损失值未达到预设的收敛条件时,迭代更新预设抽取模型中的初始参数,直至预测损失值达到收敛条件时,将收敛之后的预设抽取模型记录为短语抽取模型。本发明专利技术提高了短语抽取的效率和准确率。取的效率和准确率。取的效率和准确率。

【技术实现步骤摘要】
短语抽取模型训练、短语抽取方法、装置、设备及介质


[0001]本专利技术涉及分类模型
,尤其涉及一种短语抽取模型训练、短语抽取方法、装置、设备及介质。

技术介绍

[0002]随着科学技术的发展,自然语言处理技术也得以快速发展。在许多领域中均会使用自然语言处理技术。例如,关键词抽取、短语抽取或者文本翻译处理等。
[0003]现有技术中,一般是通过大量数据训练有监督模型或者无监督模型之后,通过有监督模型或者无监督模型进行短语抽取。但是上述两个模型在进行短语抽取之后均需要通过人工筛选方式对抽取的短语进行校验。如此,导致短语抽取效率且准确率较低。

技术实现思路

[0004]本专利技术实施例提供一种短语抽取模型训练、短语抽取方法、装置、计算机设备及存储介质,以解决现有技术中短语抽取效率和准确率较低的问题。
[0005]一种短语抽取模型训练方法,包括:
[0006]获取至少一个训练短语组;一个所述训练短语组中包括训练短语、目标短语标签、训练短语特征和训练短语向量;
[0007]获取包含初始参数的预设抽取模型;所述预设抽取模型中包括特征识别模块和短语分类模块;
[0008]将所述训练短语特征输入至所述特征识别模块中,获取第一概率值,和将所述训练短语向量输入至所述短语分类模块中,获取第二概率值;
[0009]根据所述第一概率值和所述第二概率值确定所述训练短语对应的预测短语标签,并根据所述目标短语标签和所述预测短语标签确定预测损失值;
[0010]在所述预测损失值未达到预设的收敛条件时,迭代更新所述预设抽取模型中的初始参数,直至所述预测损失值达到所述收敛条件时,将收敛之后的所述预设抽取模型记录为短语抽取模型。
[0011]一种短语抽取方法,包括:
[0012]接收包含待抽取文本的短语抽取指令,并对所述待抽取文本进行分词处理,得到至少一个待识别短语;
[0013]确定所述待识别短语对应的待识别特征和待识别向量,并将所述待识别特征和待识别向量输入至短语抽取模型中;所述短语抽取模型是根据上述短语抽取模型训练方法生成;
[0014]通过所述短语抽取模型中的特征识别模块确定所述待识别特征对应的特征概率值,和通过所述短语抽取模型中的短语分类模块确定所述待识别向量对应的分类概率值;
[0015]根据同一所述待识别短语对应的所述特征概率值和所述分类概率值确定短语概率值,并将所述短语概率值与预设概率阈值进行比较;
[0016]将大于或等于所述预设概率阈值的短语概率值对应的待识别短语作为所述待抽取文本的目标短语。
[0017]一种短语抽取模型训练装置,包括:
[0018]训练短语获取模块,用于获取至少一个训练短语组;一个所述训练短语组中包括训练短语、目标短语标签、训练短语特征和训练短语向量;
[0019]模型获取模块,用于获取包含初始参数的预设抽取模型;所述预设抽取模型中包括特征识别模块和短语分类模块;
[0020]第一概率值确定模块,用于将所述训练短语特征输入至所述特征识别模块中,获取第一概率值,和将所述训练短语向量输入至所述短语分类模块中,获取第二概率值;
[0021]损失值确定模块,用于根据所述第一概率值和所述第二概率值确定所述训练短语对应的预测短语标签,并根据所述目标短语标签和所述预测短语标签确定预测损失值;
[0022]模型更新模块,用于在所述预测损失值未达到预设的收敛条件时,迭代更新所述预设抽取模型中的初始参数,直至所述预测损失值达到所述收敛条件时,将收敛之后的所述预设抽取模型记录为短语抽取模型。
[0023]一种短语抽取装置,包括:
[0024]分词处理模块,用于接收包含待抽取文本的短语抽取指令,并对所述待抽取文本进行分词处理,得到至少一个待识别短语;
[0025]特征确定模块,用于确定所述待识别短语对应的待识别特征和待识别向量,并将所述待识别特征和待识别向量输入至短语抽取模型中;所述短语抽取模型是根据上述短语抽取模型训练方法生成;
[0026]第二概率值确定模块,用于通过所述短语抽取模型中的特征识别模块确定所述待识别特征对应的特征概率值,和通过所述短语抽取模型中的短语分类模块确定所述待识别向量对应的分类概率值;
[0027]概率值比较模块,用于根据同一所述待识别短语对应的所述特征概率值和所述分类概率值确定短语概率值,并将所述短语概率值与预设概率阈值进行比较;
[0028]目标短语确定模块,用于将大于或等于所述预设概率阈值的短语概率值对应的待识别短语作为所述待抽取文本的目标短语。
[0029]一种计算机设备,包括存储器、处理器和存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述短语抽取模型训练方法,或所述处理器执行所述计算机程序时实现上述短语抽取方法。
[0030]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述短语抽取模型训练方法,或所述计算机程序被处理器执行时实现上述短语抽取方法。
[0031]上述短语抽取模型训练、短语抽取方法、装置、计算机设备及存储介质,该方法通过在预设抽取模型中设置特征识别模块和短语分类模块,可以通过特征识别模块聚焦于训练短语的离散特征(也即上述训练短语特征),以及通过短语分类模块聚焦于训练短语的向量特征(也即上述的训练短语向量)。从而实现基于离散特征分析和向量特征分析对训练短语是否为真实短语的判定。如此,提高了短语抽取的效率和准确率。
附图说明
[0032]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是本专利技术一实施例中短语抽取模型训练方法或短语抽取方法的一应用环境示意图;
[0034]图2是本专利技术一实施例中短语抽取模型训练方法的一流程图;
[0035]图3是本专利技术一实施例中短语抽取方法的一流程图;
[0036]图4是本专利技术一实施例中短语抽取模型训练装置的一原理框图;
[0037]图5是本专利技术一实施例中短语抽取装置的一原理框图;
[0038]图6是本专利技术一实施例中计算机设备的一示意图。
具体实施方式
[0039]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]本专利技术实施例提供的短语抽取模型训练方法,该短语抽取模型训练方法可应用如图1所示的应用环境中。具体地,该短语抽取模型训练方法应用在短语抽取模型训练系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种短语抽取模型训练方法,其特征在于,包括:获取至少一个训练短语组;一个所述训练短语组中包括训练短语、目标短语标签、训练短语特征和训练短语向量;获取包含初始参数的预设抽取模型;所述预设抽取模型中包括特征识别模块和短语分类模块;将所述训练短语特征输入至所述特征识别模块中,获取第一概率值,和将所述训练短语向量输入至所述短语分类模块中,获取第二概率值;根据所述第一概率值和所述第二概率值确定所述训练短语对应的预测短语标签,并根据所述目标短语标签和所述预测短语标签确定预测损失值;在所述预测损失值未达到预设的收敛条件时,迭代更新所述预设抽取模型中的初始参数,直至所述预测损失值达到所述收敛条件时,将收敛之后的所述预设抽取模型记录为短语抽取模型。2.如权利要求1所述的短语抽取模型训练方法,其特征在于,所述获取至少一个训练短语组之前,还包括:获取样本语料集,并对所述样本语料集中的样本语料进行分词处理,得到至少一个候选短语;从预设第三方平台中获取正样本短语;一个所述正样本短语对应一个正样本标签;根据所述正样本短语和所述候选短语,从所有所述候选短语中确定负样本短语,并设置所述负样本短语对应的负样本标签;根据所述正样本短语、所述负样本短语、所述正样本短语对应的正样本标签和所述负样本短语对应的负样本标签,生成所述训练短语组。3.如权利要求2所述的短语抽取模型训练方法,其特征在于,所述根据所述正样本短语、所述负样本短语、所述正样本短语对应的正样本标签和所述负样本短语对应的负样本标签,生成所述训练短语组,包括:对所述正样本短语和所述负样本短语进行离散特征提取,得到所述正样本短语对应的训练短语特征和所述负样本短语对应的训练短语特征;对所述正样本短语和所述负样本短语进行向量转换,得到所述正样本短语对应的训练短语向量和所述负样本短语对应的训练短语向量;根据所述正样本短语、所述正样本短语对应的正样本标签、训练短语特征和训练短语向量构建所述训练短语组,以及根据所述负样本短语、所述负样本短语对应的负样本标签、训练短语特征和训练短语向量构建所述训练短语组。4.如权利要求1所述的短语抽取模型训练方法,其特征在于,所述将所述训练短语特征输入至所述特征识别模块中,获取第一概率值,包括:通过所述特征识别模块确定所述训练短语特征对应的短语特征分布;基于所述短语特征分布确定所述第一概率值。5.如权利要求1所述的短语抽取模型训练方法,其特征在于,所述将所述训练短语向量输入至所述短语分类模块中,获取第二概率值,包括:通过所述短语分类模块中的卷积网络层对所述训练短语向量进行卷积处理,得到卷积特征向量;
通过所述短语分类模块中的池化网络层对所述卷积特征向量进行池化处理,得到池化特征向量;通过所述短语分类模块中的全连接层根据所述池化特征向量,确定所述第二概率值。6.一种短语抽取方法,其特征在于,包括:接收包含待抽取文本的短语抽取指令,并对所述待抽取文本进行分词处理,得到至少一个待识别短语;确定所述待识别短语对应...

【专利技术属性】
技术研发人员:唐亚
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1