一种对象标记方法、装置、服务器及存储介质制造方法及图纸

技术编号:24684310 阅读:53 留言:0更新日期:2020-06-27 08:12
本发明专利技术实施例提供了一种对象类型标记方法、装置、服务器及存储介质,该方法包括:获取与对象提供方关联的至少一个对象集合,所述对象集合包括所述对象提供方提供的预聚集的多个对象;根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度;根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据;根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系;根据所述对应关系,为所述对象提供方提供的对象标记类型,提升了对象标记的覆盖率。

An object marking method, device, server and storage medium

【技术实现步骤摘要】
一种对象标记方法、装置、服务器及存储介质
本专利技术实施例涉及数据处理
,具体涉及一种对象标记方法、装置、服务器及存储介质。
技术介绍
对象标记是指为对象提供方提供的对象标记相应的类型,其在相似对象确定、对象推荐等场景下具有广泛应用。目前主要是通过记录类型对应的关键词,将对象的相关信息与类型对应的关键词进行匹配,以确定对象相匹配的类型,实现为对象标记类型。然而,各类型对应的关键词难以穷举,这导致一个类型对应的关键词难以覆盖属于该类型的所有对象,因此基于类型对应的关键词进行对象标记,可能存在无法被标记的对象,这无疑存在对象标记的覆盖率较低的问题;因此如何改进对象标记方式,以提升对象标记的覆盖率,成为了本领域技术人员亟需解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种对象标记方法、装置、服务器及存储介质,以提升对象标记的覆盖率。为实现上述目的,本专利技术实施例提供如下技术方案:一种对象标记方法,包括:获取与对象提供方关联的至少一个对象集合,所述对象集合包括所述对象提供方提供的预聚集的多个对象;根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度;所述目标对象集合包括多个所述对象提供方关联的对象集合中的不同对象,且,所述目标对象集合中第一部分的对象已确定类型数据,第二部分的对象未确定类型数据;根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据;根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系;根据所述对应关系,为所述对象提供方提供的对象标记类型。可选的,所述根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度包括:针对所述目标对象集合中的任一个对象,根据所述对象所属的对象集合中的上下文,确定所述对象的对象向量;所述上下文为所述对象所属的对象集合中,位于所述对象之前的对象及位于所述对象之后的对象;根据所述目标对象集合中各对象的对象向量,确定所述目标对象集合中各对象之间的相似度。可选的,所述根据所述对象所属的对象集合中的上下文,确定所述对象的对象向量包括:根据所述对象在所属的对象集合中的上下文,确定所述对象的词向量,所述词向量作为所述对象向量;其中,所述对象集合中的一个对象定义为一个词单元,一个所述对象集合定义为一个句单元。可选的,所述上下文具体为所述对象所属的对象集合中,位于所述对象之前的第一预设数量的对象,及位于所述对象之后的第一预设数量的对象;所述第一预设数量大于或等于,所述多个对象提供方关联的对象集合中的对象数量的最大值。可选的,所述根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据,包括:以所述目标对象集合中的对象为节点,所述目标对象集合中各对象之间的相似度为节点的连接边的权值,构建标签数据传播图;其中,标签数据传播图中的节点包括所述第一部分对象的第一节点,和所述第二部分对象的第二节点;根据所述第一部分的对象的类型数据,确定所述标签数据传播图中第一节点的标签数据,其中,一个节点的标签数据包括所述节点的对象的类型分布数据;根据所述标签数据传播图中各节点之间的连接关系、各节点之间的连接边的权值,及所述第一节点的标签数据,预测所述标签数据传播图中第二节点的标签数据;根据所述第二节点的标签数据,确定所述第二部分的对象的类型数据。可选的,所述根据所述标签数据传播图中各节点之间的连接关系、各节点之间的连接边的权值,及所述第一节点的标签数据,预测所述标签数据传播图中第二节点的标签数据,包括:针对标签数据传播图中的任一第二节点,根据所述标签数据传播图中各节点之间的连接关系,确定所述第二节点的相邻节点及所述相邻节点的标签数据;根据所述相邻节点的标签数据,及所述相邻节点与所述第二节点的连接边的权值,确定所述第二节点的标签数据;其中,所述相邻节点与所述第二节点的连接边的权值,与所述相邻节点和所述第二节点的标签数据的接近程度为正相关关系。可选的,所述类型数据包括对应目标类型的目标类型数据和对应非目标类型的非目标类型数据;所述根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系,包括:基于所述第一部分的对象中目标类型数据对应的对象,及所述第二部分的对象中目标类型数据对应的对象,确定目标类型数据与对象的初始对应关系;获取针对所述初始对应关系的审核信息,在所述审核信息指示所述初始对应关系审核通过时,将所述初始对应关系作为目标类型数据与对象的目标对应关系。一种对象标记装置,包括:对象集合获取单元,用于获取与对象提供方关联的至少一个对象集合,所述对象集合包括所述对象提供方提供的预聚集的多个对象;相似度确定单元,用于根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度;所述目标对象集合包括多个所述对象提供方关联的对象集合中的不同对象,且,所述目标对象集合中第一部分的对象已确定类型数据,第二部分的对象未确定类型数据;第二类型数据确定单元,用于根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据;对应关系确定单元,用于根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系;标记单元,用于根据所述对应关系,为所述对象提供方提供的对象标记类型。一种平台服务器,其特征在于,包括至少一个存储器和至少一个处理器;所述存储器存储一条或多条计算机可执行指令,所述处理器调用所述一条或多条计算机可执行指令,以执行以上对象标记方法。一种存储介质,所述存储介质存储一条或多条计算机可执行指令,所述一条或多条计算机可执行指令用于执行以上对象标记方法。本专利技术实施例提供的对象类型标记方法,利用对象提供方关联的对象集合的聚类性质,通过获取与对象提供方关联的至少一个对象集合,进而根据多个所述对象提供方关联的对象集合,确定包括多个所述对象提供方关联的对象集合中的不同对象的目标对象集合中各对象的相似度,并进一步根据所述目标对象集合中各对象的相似度,及已确定的第一部分的对象的类型数据,确定所述第二部分的对象的类型数据,从而确定对象与类型的对应关系,得到属于对应类型的准确对象,进而根据所述对应关系,为所述对象提供方提供的对象标记类型。基于对象提供方提供的数据,利用对象提供方关联的对象集合的聚类性质,得到属于对应类型的准确对象,实现了直接对对象的尽可能穷举,进而为所述对象提供方提供的对象标记类型,提高了对象标记的覆盖率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人本文档来自技高网...

【技术保护点】
1.一种对象标记方法,其特征在于,包括:/n获取与对象提供方关联的至少一个对象集合,所述对象集合包括所述对象提供方提供的预聚集的多个对象;/n根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度;所述目标对象集合包括多个所述对象提供方关联的对象集合中的不同对象,且,所述目标对象集合中第一部分的对象已确定类型数据,第二部分的对象未确定类型数据;/n根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据;/n根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系;/n根据所述对应关系,为所述对象提供方提供的对象标记类型。/n

【技术特征摘要】
1.一种对象标记方法,其特征在于,包括:
获取与对象提供方关联的至少一个对象集合,所述对象集合包括所述对象提供方提供的预聚集的多个对象;
根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度;所述目标对象集合包括多个所述对象提供方关联的对象集合中的不同对象,且,所述目标对象集合中第一部分的对象已确定类型数据,第二部分的对象未确定类型数据;
根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据;
根据所述第一部分的对象及所述第二部分的对象的类型数据,确定对象与类型的对应关系;
根据所述对应关系,为所述对象提供方提供的对象标记类型。


2.根据权利要求1所述的对象标记方法,其特征在于,所述根据多个所述对象提供方关联的对象集合,确定目标对象集合中各对象之间的相似度包括:
针对所述目标对象集合中的任一个对象,根据所述对象所属的对象集合中的上下文,确定所述对象的对象向量;所述上下文为所述对象所属的对象集合中,位于所述对象之前的对象及位于所述对象之后的对象;
根据所述目标对象集合中各对象的对象向量,确定所述目标对象集合中各对象之间的相似度。


3.根据权利要求2所述的对象标记方法,其特征在于,所述根据所述对象所属的对象集合中的上下文,确定所述对象的对象向量包括:
根据所述对象在所属的对象集合中的上下文,确定所述对象的词向量,所述词向量作为所述对象向量;其中,所述对象集合中的一个对象定义为一个词单元,一个所述对象集合定义为一个句单元。


4.根据权利要求2或3所述的对象标记方法,其特征在于,所述上下文具体为所述对象所属的对象集合中,位于所述对象之前的第一预设数量的对象,及位于所述对象之后的第一预设数量的对象;所述第一预设数量大于或等于,所述多个对象提供方关联的对象集合中的对象数量的最大值。


5.根据权利要求1或2所述的对象标记方法,其特征在于,所述根据所述目标对象集合中各对象之间的相似度,及所述第一部分的对象的类型数据,确定所述第二部分的对象的类型数据,包括:
以所述目标对象集合中的对象为节点,所述目标对象集合中各对象之间的相似度为节点的连接边的权值,构建标签数据传播图;其中,标签数据传播图中的节点包括所述第一部分对象的第一节点,和所述第二部分对象的第二节点;
根据所述第一部分的对象的类型数据,确定所述标签数据传播图中第一节点的标签数据,其中,一个节点的标签数据包括所述节点的对象的类型分布数据;
根据所述标签数据传播图中各节点之间的连接关系、各节点之间的连接边的权值,及所述第一节点的标签数据,预测所述标签数据传播图中第二...

【专利技术属性】
技术研发人员:吴迪
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1