【技术实现步骤摘要】
模型训练方法、装置、电子设备及存储介质
[0001]本公开涉及计算机技术
,具体涉及一种模型训练方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网技术的发展,越来越多的资源(如产品、服务等)通过互联网平台来提供。而为了使用户能够准确找到所需要的资源,互联网平台通常会为用户提供搜索入口,用户通过搜索入口输入查询语句或者关键词,互联网平台调用搜索引擎从众多资源中匹配到最相关的搜索结果并战象给用户。以购物平台为例,买家通过购物平台输入的搜索入口输入查询语句或关键词,购物平台通过相关性算法检索出最相关的商品,而中心词是相关性算法中最为重要的一个部分,其分别提取出查询语句或关键词和商品标题的中心词,然后通过所提取出的中心词,进而得到查询语句或关键词与商品之间的相关性分数,最终根据相关性分数得到搜索结果。因此,如何准确提取出中心词是提高互联网平台中搜索准确率的关键环节。
技术实现思路
[0003]本公开实施例提供一种模型训练方法、装置、电子设备及计算机可读存储介质。
[0004]第一方面,本 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取多个样本数据,所述样本数据为包括至少一个中心词和至少一个非中心词的句子;将所述样本数据转换成依存图结构的数据,所述依存图结构中所述中心词和非中心词分别作为节点,所述中心词之间两两相连;使用多个样本数据及其对应的依存图结构的数据训练依存图模型,得到训练后的依存图模型。2.根据权利要求1所述的方法,其特征在于,所述将所述样本数据转换成依存图结构的数据,包括:为句子增加中心词父节点代表词和非中心词父节点代表词;按照预定顺序对所述句子进行遍历,如果遍历到中心词,则将所述中心词作为依存树中所述中心词父节点代表词的子节点;如果遍历到非中心词,则将所述非中心词作为所述非中心词父节点代表词的子节点;将所述中心词父节点代表词的子节点两两相连,构成一个带有环的依存图。3.根据权利要求2所述的方法,其特征在于,将所述样本数据转换成依存图结构的数据还包括:如果遍历到中心词短语,则将所述中心词短语的第一个词作为所述中心词父节点代表词的子节点;将所述中心词短语中的后续词作为前一个词的子节点。4.根据权利要求1所述的方法,其特征在于,所述使用多个样本数据及其对应的依存图结构的数据训练依存图模型,包括:利用所述依存图模型对所述样本数据进行处理得到预测结果;所述预测结果包括所述依存图结构中任一节点成为其他节点的父节点的预测概率;根据所述预测结果,利用目标函数对所述依存图模型的参数进行优化调整;所述目标函数用于最大化所述依存图结构中各节点成为其他节点的父节点的预测概率。5.一种中心词提取方法,其中,包括:获取待识别语句;利用依存图模型识别所述待识别语句对应的依存图结构;所述依存图模型利用权利要求1-4任一项所述的方法训练得到;根据所述依存图结构提取所述待识别语句中的中心词。6.根据权利要求5所述的方法,其中,根据所述依存图结构提取所述待识别语句中的中心词,包括:根据所述依存图结构确定所述待识别语句中各个词的父节点;根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词。7.根据权利要求6所述的方法,其中,根据所述父节点是否为中心词父节点代表词确定所述词是否为中心词,包括:将所述父节点包括所述中心词父节点代表词的所述词确定为中心词。8.根据权利要求6所述的方法,其中,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,包括:将所述父节点包括所述中心词父节点代表词的所述词确定为候选词;
根据所述候选词的所述父节点中是否还包括其它词确定所述候选词是否为中心词。9.根据权利要求8所述的方法,其中,根据所述候选词的所述父节点信息中是否还包括其它词确定所述候选词是否为中心词,包括:在所述候选词的所述父节点中包括其它词时,根据所述其它词的数量确定所述候选词为中心词的概率。10.根据权利要求6-9任一项所述的方法,其中,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,还包括:确定以所述中心词为首的目标短语;所述目标短语中后一词的所述父节点信息包括前一词且不包括所述中心词父节点代表词;将所述目标短语确定为中心词组。11.一种中心词提取方法,其中,包括:获取待识别语句;利用依存图模型识别所述待识别语句对应的依存图结构;所述依存图结构中所述待识别语句的中心词和非中心词作为节点,所述中心词之间两两相连;根据所述依存图结构提取所述待识别语句中的中心词。12.根据权利要求11所述的方法,其中,所述依存图结构中还包括中心词父节点代表词,所述中心词父节点代表词为所述待识别语句中各中心词的父节点。13.根据权利要求12所述的方法,其中,根据所述依存图结构提取所述待识别语句中的中心词...
【专利技术属性】
技术研发人员:蒋勇,王涛,黄非,司罗,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。