【技术实现步骤摘要】
推荐方法、模型训练方法、装置、设备和存储介质
[0001]本专利技术实施例涉及计算机
,尤其涉及一种推荐方法、模型训练方法、装置、设备和存储介质。
技术介绍
[0002]目前,相似企业推荐的方法主要依赖于企业的基本工商信息,包括企业所属行业、企业地区、企业注册资本等等。通过对这些字段进行聚类或者相似度计算等方法,可以在一定程度上寻找到一些广义的相似企业。
[0003]现有技术中有一种方案利用企业的名称以及企业的经营范围这两种特征,根据文本中的词语推导出主题模型,用于企业的相似推荐。但是,这种推荐方法的结果常常不够准确。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供一种推荐方法、模型训练方法、装置、设备和存储介质,以解决或缓解上述问题。
[0005]根据本专利技术实施例的第一方面,提供了一种推荐方法,包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。
[0006]根据本专利技术实施例的第二方面,提供了一种模型训练方法,包括:获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以 ...
【技术保护点】
【技术特征摘要】
1.一种推荐方法,包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。2.根据权利要求1所述的方法,其中,所述根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度,包括:根据所述候选主体在第一维度上的关键词确定所述候选主体的在所述第一维度上的第一特征词向量;以及,根据所述目标主体在所述第一维度上的关键词确定所述目标主体在所述第一维度上的第二特征词向量;将所述第一特征词向量和所述第二特征词向量输入预先训练的相似度预测模型中,得到所述候选主体与所述目标主体在所述第一维度上的相似度。3.根据权利要求2所述的方法,其中,所述相似度预测模型包括注意力机制层和全连接层,所述将所述第一特征词向量和所述第二特征词向量输入到预先训练的相似度预测模型中,包括:将所述第一特征词向量和所述第二特征词向量输入到所述注意力机制层中,进行线性变换处理;将经过线性变换处理的第一特征词向量和第二特征词向量输入到所述全连接层中。4.根据权利要求2所述的方法,其中,所述根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度,还包括:将所述候选主体在第二维度上的关键词进行词向量处理,得到所述候选主体在所述第二维度上的第一特征词向量;以及,将所述目标主体在所述第二维度上的关键词进行词向量处理,得到所述目标主体在所述第二维度上的第二特征词向量;将所述候选主体在所述第一维度上的第一特征向量以及在所述第二维度上的第一特征向量进行加权计算,得到所述候选主体的第一特征词向量;以及,将所述目标主体在所述第一维度上的第二特征向量以及在所述第二维度上的第二特征向量进行加权计算,得到所述目标主体的第二特征词向量。5.根据权利要求1所述的方法,其中,所述根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体,包括:在所述候选主体所在的候选主体集合中,确定满足召回主体数目的多个主体,其中,所述召回主体数目基于推荐主体数目和召回比例信息确定;基于所述相似度,从满足所述召回主体数目的多个主体中选择所述目标主体的推荐主体。6.根据权利要求5所述的方法,其中,所述根据所述第一描述信息确定所述候选主体在每个维度上的关键词,包括:
从所述第一描述信息中获得每个维度的关键词的词频逆文档频率得分;根据所述词频逆文档频率得分对同一维度的关键词进行排序,得到所述候选主体在每个维度上的关键词,所述根据所述第二描述信息确定所述目标主体在每个维度上的关键词,包括:从所述第二描述信息中获得每个维度的关键词的词频逆文档频率得分;根据所述词频逆文档频率得分对同一维度的关键词进行排序,得到所述目标主体在每个维度上的关键词。7.根据权利要求6所述的方法,其中,所述获得每个维度的关键词的词频逆文档频率得分,包括:获得每个维度的每个关键词的词频得分和逆文档频率得分;根据所述词频得分和所述逆文档频率得分得到每个维度的关键词的词频逆文档频率得分,其中,所述词频得分表示特定关键词在特定维度的描述信息中出现的次数与所述特定维度的描述信息中的多个关键词的数目之间比例关系,所述逆文档频率得分表示所述召回主体数目与所述特定维度的描述信息中出现所述特定关键词的主体数目之间的比例关系。8.一种模型训练...
【专利技术属性】
技术研发人员:李旭瑞,孙常龙,李红松,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。