【技术实现步骤摘要】
一种功效词抽取方法、模型训练方法、电子设备及介质
[0001]本申请涉及计算机
,尤其是涉及一种功效词抽取方法、模型训练方法、电子设备及介质。
技术介绍
[0002]随着信息技术的发展以及科技的进步,各种论文、专利等文本文件越来越多,为了更好的对这些文本文件进行分析,可能需要对这些文本文件进行分类。在对这些文本文件进行分类时,可能要根据这些文本文件中所实现的功能或者效果进行分类,也即根据功效词对这些文本文件进行分类,因此,如何从这些文本文件中抽取功效词成为一个关键问题。
[0003]在相关技术中,一般通过人工阅读各个文本文件,从中查找并抽取各个文本文件的功效词。但是,专利技术人在研究过程中发现,通过人工阅读文本文件抽取功效词的方式,可能需要的时间较长,并且抽取功效词的准确度较低。
技术实现思路
[0004]本申请目的是提供一种功效词抽取方法、模型训练方法、电子设备及介质,用于解决以上技术问题。
[0005]第一方面,提供了一种功效词抽取方法,包括:获取目标文本信息;将所述目标文本信息通过 ...
【技术保护点】
【技术特征摘要】
1.一种功效词抽取方法,其特征在于,包括:获取目标文本信息;将所述目标文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词;其中,所述功效词抽取模型为基于多个文本样本以及各自对应的标准功效词进行训练后得到的。2.根据权利要求1所述的方法,其特征在于,所述将所述目标文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词,包括:对所述目标文本信息进行编码处理,得到目标文本信息的文本语义表示;对所述文本语义表示进行解码处理,得到所述目标文本信息对应的标准功效词。3.根据权利要求2所述的方法,其特征在于,所述对所述目标文本信息进行编码处理,得到目标文本信息的文本语义表示,包括:将所述目标文本信息中的每个字转换为字向量、位置向量以及文本向量;将每个字对应的字向量、位置向量以及文本向量进行拼接处理以生成输入向量,得到输入向量集合;将所述输入向量集合进行编码处理,得到所述目标文本信息的文本语义表示。4.根据权利要求1所述的方法,其特征在于,所述将所述目标文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词,之前还包括:对所述目标文本信息进行文本预处理,得到预处理后的文本信息,所述文本预处理包括:去除停用词处理、去除表达式处理以及去除特殊符号处理中的至少一项;其中,所述将所述目标文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词,包括:将所述预处理后的文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词。5.根据权利要求1所述的方法,其特征在于,所述将所述目标文本信息通过功效词抽取模型进行功效词抽取,得到所述目标文本信息对应的标准功效词,之前还包括:获取初始模型,所述初始模型包括:初始编码模型;基于所述多个文本样本对所述初始编码模型进行训练,得到预训练编码模型。6.根据权利要求5所述的方法,其特征在于,所述初始模型还包括:解码模型;所述方法还包括:将各文本样本输入至所述预训练编码模型,得到各文本样本分别对应的文本语义表示;将各文本语义表示输入至所述初始解码模型,得到各文本样本分别对应的标准功效词;根据各标准功效词以及各自对应的标准功效词标签,确定训练损失值;根据所述训练损失值和所述训练样本对所述预训练网络进行迭代训练,直至所述训练损失值符合训练结束条件时,将训练结束时的网络确定为所述功效性抽取模型。7.一种模型训练方法,其特征在于,包括:获取训练样本,所述训练样本包括:多个文本信息以及各自对应的标准功效词标签;
基于所述训练样本对初始模型进行训练,得到功效词抽取模型,以用于抽取标准功效词。8.根据权利要求7所述的方法,其...
【专利技术属性】
技术研发人员:黄威威,蔡子哲,
申请(专利权)人:企知道网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。