推荐方法、模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号:34548223 阅读:20 留言:0更新日期:2022-08-17 12:31
本发明专利技术实施例提供了一种推荐方法、模型训练方法、装置、设备和存储介质。所述推荐方法包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。本发明专利技术实施例的方案能够进行更准确的主体推荐。进行更准确的主体推荐。进行更准确的主体推荐。

【技术实现步骤摘要】
推荐方法、模型训练方法、装置、设备和存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种推荐方法、模型训练方法、装置、设备和存储介质。

技术介绍

[0002]目前,相似企业推荐的方法主要依赖于企业的基本工商信息,包括企业所属行业、企业地区、企业注册资本等等。通过对这些字段进行聚类或者相似度计算等方法,可以在一定程度上寻找到一些广义的相似企业。
[0003]现有技术中有一种方案利用企业的名称以及企业的经营范围这两种特征,根据文本中的词语推导出主题模型,用于企业的相似推荐。但是,这种推荐方法的结果常常不够准确。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种推荐方法、模型训练方法、装置、设备和存储介质,以解决或缓解上述问题。
[0005]根据本专利技术实施例的第一方面,提供了一种推荐方法,包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。
[0006]根据本专利技术实施例的第二方面,提供了一种模型训练方法,包括:获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
[0007]根据本专利技术实施例的第三方面,提供了一种主体推荐装置,包括:获取模块,获取候选主体在多个维度的第一描述信息,并且获取目标主体在所述多个维度的第二描述信息;第一确定模块,根据所述第一描述信息确定所述候选主体在每个维度上的关键词,并且根据所述第二描述信息确定所述目标主体在每个维度上的关键词;第二确定模块,根据所述候选主体和所述目标主体在多个同一维度上的关键词,确定所述候选主体与所述目标主体的相似度;推荐模块,根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。
[0008]根据本专利技术实施例的第四方面,提供了一种模型训练装置,包括:获取模块,获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;训练模块,基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
[0009]根据本专利技术实施例的第五方面,提供了一种电子设备,所述设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
[0010]根据本专利技术实施例的第六方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
[0011]在本专利技术实施例的方案中,能够根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,由于相同的多个维度能够更全面反映候选主体和目标主体之间的关联程度,因此根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体时,能够进行更准确的主体推荐。
附图说明
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0013]图1为本专利技术的一个实施例的推荐方法的示意性流程图;
[0014]图2为本专利技术的另一实施例的相似度预测模型的架构的示意图;
[0015]图3为本专利技术的另一实施例的相似度预测模型的一个示例的向量处理的示意图;
[0016]图4为本专利技术的另一实施例的相似度预测模型的另一示例的向量处理的示意图;
[0017]图5为本专利技术的另一实施例的模型训练方法的示意性流程图;
[0018]图6为本专利技术的另一实施例的主体推荐装置的示意性框图;
[0019]图7为本专利技术的另一实施例的模型训练装置的示意性框图;
[0020]图8为本专利技术的另一实施例的电子设备的硬件结构。
具体实施方式
[0021]为了使本领域的人员更好地理解本专利技术实施例中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。
[0022]下面结合本专利技术实施例附图进一步说明本专利技术实施例具体实现。
[0023]通常,在利用企业的名称以及企业的经营范围这两种特征进行企业推荐的情况下,存在诸多缺点。一方面,企业名称和经营范围包含的信息量较少,并且企业名称和经营范围由于企业在工商注册的时候主观填报而存在申报不准、虚假填写或者经营内容重大变更等各种因素的干扰。另一方面,诸如企业经营范围等文字描述的核心信息难以提取,并且相似企业的定义比较宽泛,对于不同的服务场景没有区分作用。因此,本专利技术实施例提供了一种推荐方法,能够解决上述问题。
[0024]图1为本专利技术的一个实施例的推荐方法的示意性流程图。图1的推荐方法可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、
PAD等)和PC机等。该推荐方法包括:
[0025]110:获取候选主体在多个维度的第一描述信息,根据第一描述信息确定候选主体在每个维度上的关键词;以及,获取目标主体在多个维度的第二描述信息,并根据第二描述信息确定目标主体在每个维度上的关键词。
[0026]应理解,文中的描述信息包括文本信息、语音信息和视觉信息中的至少一种。文中的主体包括但不限于企业、或非企业机构、组织等。
[0027]还应理解,多个维度的描述信息包括但不限于工商注册中的经营范围信息、主体的专利、著作权、招聘信息等。多个维度的描述信息可以分为主体唯一对应的描述信息和非唯一对应的描述信息。主体唯一对应的描述信息包括但不限于主体的工商登记的经营范围、主体的百度百科描述等。非唯一对应的描述信息包括但不限于专利、著作权或者招聘信息等。对于唯一对应的文本信,可以将主体唯一对应的描述直接当文本,参考TFIDF(词频逆文档频率)的计算逻辑,得到TFIDF的值。对于非唯一对应的描述信息,可以将文本得到的统计结果(例如,关键词)融合到主体维度。
[0028]还应理解,对于多个维度的描述信息,例如,可以基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐方法,包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。2.根据权利要求1所述的方法,其中,所述根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度,包括:根据所述候选主体在第一维度上的关键词确定所述候选主体的在所述第一维度上的第一特征词向量;以及,根据所述目标主体在所述第一维度上的关键词确定所述目标主体在所述第一维度上的第二特征词向量;将所述第一特征词向量和所述第二特征词向量输入预先训练的相似度预测模型中,得到所述候选主体与所述目标主体在所述第一维度上的相似度。3.根据权利要求2所述的方法,其中,所述相似度预测模型包括注意力机制层和全连接层,所述将所述第一特征词向量和所述第二特征词向量输入到预先训练的相似度预测模型中,包括:将所述第一特征词向量和所述第二特征词向量输入到所述注意力机制层中,进行线性变换处理;将经过线性变换处理的第一特征词向量和第二特征词向量输入到所述全连接层中。4.根据权利要求2所述的方法,其中,所述根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度,还包括:将所述候选主体在第二维度上的关键词进行词向量处理,得到所述候选主体在所述第二维度上的第一特征词向量;以及,将所述目标主体在所述第二维度上的关键词进行词向量处理,得到所述目标主体在所述第二维度上的第二特征词向量;将所述候选主体在所述第一维度上的第一特征向量以及在所述第二维度上的第一特征向量进行加权计算,得到所述候选主体的第一特征词向量;以及,将所述目标主体在所述第一维度上的第二特征向量以及在所述第二维度上的第二特征向量进行加权计算,得到所述目标主体的第二特征词向量。5.根据权利要求1所述的方法,其中,所述根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体,包括:在所述候选主体所在的候选主体集合中,确定满足召回主体数目的多个主体,其中,所述召回主体数目基于推荐主体数目和召回比例信息确定;基于所述相似度,从满足所述召回主体数目的多个主体中选择所述目标主体的推荐主体。6.根据权利要求5所述的方法,其中,所述根据所述第一描述信息确定所述候选主体在每个维度上的关键词,包括:
从所述第一描述信息中获得每个维度的关键词的词频逆文档频率得分;根据所述词频逆文档频率得分对同一维度的关键词进行排序,得到所述候选主体在每个维度上的关键词,所述根据所述第二描述信息确定所述目标主体在每个维度上的关键词,包括:从所述第二描述信息中获得每个维度的关键词的词频逆文档频率得分;根据所述词频逆文档频率得分对同一维度的关键词进行排序,得到所述目标主体在每个维度上的关键词。7.根据权利要求6所述的方法,其中,所述获得每个维度的关键词的词频逆文档频率得分,包括:获得每个维度的每个关键词的词频得分和逆文档频率得分;根据所述词频得分和所述逆文档频率得分得到每个维度的关键词的词频逆文档频率得分,其中,所述词频得分表示特定关键词在特定维度的描述信息中出现的次数与所述特定维度的描述信息中的多个关键词的数目之间比例关系,所述逆文档频率得分表示所述召回主体数目与所述特定维度的描述信息中出现所述特定关键词的主体数目之间的比例关系。8.一种模型训练...

【专利技术属性】
技术研发人员:李旭瑞孙常龙李红松
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1