【技术实现步骤摘要】
基于知识图谱的对象识别方法、装置、可读介质和设备
[0001]本公开涉及电子信息处理
,具体地,涉及一种基于知识图谱的对象识别方法、装置、可读介质和设备。
技术介绍
[0002]随着电子信息技术的不断发展,应用市场上出现了各种各样的游戏类应用程序。在游戏运营过程中,会通过投放多媒体内容的方式,来增加游戏的曝光度,从而提高游戏的活跃量。为了提高投放的准确度,通常会在多种投放平台中选择适用于该游戏的目标投放平台,并在目标投放平台上定向投放。现有技术中,存在基于知识图谱来识别目标对象,进行精准投放的方法,然而这种方式需要对象与游戏之间存在交互行为,对于新上架的游戏来说,对象与游戏之间往往不存在交互行为,或者存在很少的交互行为,知识图谱会出现冷启动的问题,导致无法识别目标对象。
技术实现思路
[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种基于知识图谱的对象识别方法,所述方法包括:
[0005]根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;
[0006]根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的对象识别方法,其特征在于,所述方法包括:根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,包括:将所述待识别对象向量、所述目标游戏向量和所述待识别对象的对象特征,输入所述识别模型,以得到所述识别模型输出的所述待识别对象与所述目标游戏的相关度,所述对象特征根据所述待识别对象的对象信息确定。3.根据权利要求1或2所述的方法,其特征在于,所述游戏知识图谱包括多个节点和至少一个边,所述多个节点包括:对象节点、游戏节点和内容节点;每个边用于表征该边两端的两个节点之间具有关联。4.根据权利要求3所述的方法,其特征在于,所述对象节点包括多个样本对象对应的对象节点,所述样本对象包括正样本对象和负样本对象,所述正样本对象包括所述种子对象;所述方法还包括:针对所述目标游戏训练所述识别模型;所述针对所述目标游戏训练所述识别模型,包括:获取样本输入集,所述样本输入集包括:每个所述样本对象对应的样本输入,所述样本输入包括:根据所述游戏知识图谱确定的,用于表征该样本对象的对象向量和所述目标游戏向量;获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本对象的真实识别结果;将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。5.根据权利要求4所述的方法,其特征在于,所述正样本对象还包括扩展对象,所述扩展对象是通过以下方式确定的:根据用于表征其他游戏的其他游戏向量与所述目标游戏向量,确定所述其他游戏与所述目标游戏的相关度,所述其他游戏为除所述目标游戏之外的游戏,所述其他游戏向量根据所述游戏知识图谱确定;将与所述目标游戏的相关度大于或等于预设的相关度阈值的所述其他游戏,作为所述目标游戏对应的相关游戏;将所述相关游戏的活跃对象作为所述扩展对象。6.根据权利要求4所述的方法,其特征在于,所述将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型,包括:按照预设的聚类算法对所述样本输入集进行聚类,以得到多组样本输入子集,每组所
述样本输入子集对应一组样本输出子集;针对每组所述样本输入子集,将该组样本输入子集输入所述识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型;所述识别模型的输出,根据每组所述样本输入子集对应的识别子模型的输出确定。7.根据权利要求6所述的方法,其特征在于,每组所述样本输入子集对应的识别子模型,为树集成模型,包括多个树模型;所述将该组样本输入子集输入所述识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型,包括:针对每个所述树模型,对该组样本输入子集进行随机采样,以得到采样输入子集,所述采样输入子集包括的所述样本输入的数量,小于该组样本输入子集包括的所述样本输入的数量;对所述采样输入子集中包括的每个所述样本输入进行随机采样,以得到该样本输入对应的采样样本输入,所述采样样本输入属于该样本输入;将所述采样输入子集中包括的每个所述样本输入对应的采样样本输入作为该树模型的输入,将所述采样输入子集中包括的每个所述样本输入对应的所述样...
【专利技术属性】
技术研发人员:刘江冬,钟黎,易坤,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。