一种数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:37253767 阅读:10 留言:0更新日期:2023-04-20 23:30
本申请实施例提供了一种数据处理方法、装置、计算机设备及存储介质,该数据处理方法包括:获取P个目标对象的属性数据和目标数据;根据P个目标对象的属性数据,构建P个目标对象的对象特征;对P个目标对象的目标数据进行基于序列模式的挖掘分析,得到P个目标对象的访问信息;根据P个目标对象的对象特征以及P个目标对象的访问信息,对P个目标对象进行集成聚类处理,得到多个聚类簇;根据每个聚类簇中的对象类型,确定各个聚类簇的分类类型。采用本申请实施例,可以提高对象识别的准确率。可以提高对象识别的准确率。可以提高对象识别的准确率。

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、一种数据处理装置、一种计算机设备以及一种计算机可读存储介质。

技术介绍

[0002]随着计算机技术的快速进步,互联网行业和互联网产品(例如各类应用程序、门户网站、搜索引擎等等)得到了蓬勃发展,对象识别(也可称为对象挖掘)对互联网行业发展、互联网产品运营、互联网业务引流起到至关重要的作用。例如,通过识别视频播放类互联网产品中特定类型的目标对象,可以增强对象群体之间的传播效应,提高视频播放类互联网产品的页面访问量;又如,通过识别资讯论坛类互联网产品中特定类型的目标对象,可以有效地带动行业信息方向。目前,互联网产品中涉及的对象识别方案主要包括两种,一种是基于规则或神经网络构建对象社交关系网络,通过扩展对象群体的方式识别对象;另一种是训练分类模型,通过训练好的分类模型识别对象;实践发现,上述两种对象识别方案因通用性不高、泛化能力低、忽略对象之间的群体效应等因素,导致对象识别准确率较低,因此如何提高对象识别的准确率成为当前研究的热点话题。

技术实现思路

[0003]本申请实施例提供了一种数据处理方法、装置、计算机设备及存储介质,可以提高对象识别的准确率。
[0004]一方面,本申请实施例提供了一种数据处理方法,该数据处理方法包括:
[0005]获取P个目标对象的属性数据和目标数据;P个目标对象中的第i个目标对象的目标数据包括第i个目标对象在时间周期内针对目标业务的多个访问数据,P为大于或等于2的整数,i为小于或等于P的正整数;
[0006]根据P个目标对象的属性数据,构建P个目标对象的对象特征;
[0007]对P个目标对象的目标数据进行基于序列模式的挖掘分析,得到P个目标对象的访问信息;
[0008]根据P个目标对象的对象特征以及P个目标对象的访问信息,对P个目标对象进行集成聚类处理,得到多个聚类簇;每个聚类簇中包含P个目标对象中的至少一个目标对象;
[0009]根据每个聚类簇中的对象类型,确定各个聚类簇的分类类型。
[0010]一方面,本申请实施例提供了一种数据处理装置,该数据处理装置包括:
[0011]获取单元,用于获取P个目标对象的属性数据和目标数据;P个目标对象中的第i个目标对象的目标数据包括第i个目标对象在时间周期内针对目标业务的多个访问数据,P为大于或等于2的整数,i为小于或等于P的正整数;
[0012]处理单元,用于根据P个目标对象的属性数据,构建P个目标对象的对象特征;
[0013]处理单元,还用于对P个目标对象的目标数据进行基于序列模式的挖掘分析,得到P个目标对象的访问信息;
[0014]处理单元,还用于根据P个目标对象的对象特征以及P个目标对象的访问信息,对P个目标对象进行集成聚类处理,得到多个聚类簇;每个聚类簇中包含P个目标对象中的至少一个目标对象;
[0015]处理单元,还用于根据每个聚类簇中的对象类型,确定各个聚类簇的分类类型。
[0016]在一种实现方式中,第i个目标对象的访问信息用于反映第i个目标对象在时间周期内针对目标业务的多个访问数据之间的共性信息;处理单元,用于根据P个目标对象的对象特征以及P个目标对象的访问信息,对P个目标对象进行集成聚类处理,得到多个聚类簇时,具体用于执行如下步骤:
[0017]根据P个目标对象的对象特征以及P个目标对象的访问信息,构建P个目标对象的聚类特征向量;
[0018]根据至少一种聚类算法以及P个目标对象的聚类特征向量,对P个目标对象进行聚类处理,得到多个聚类结果,每个聚类结果指示P个目标对象的一种聚类策略;
[0019]调用一致性函数从多个聚类结果中确定一致性聚类结果,并根据一致性聚类结果所指示的聚类策略将P个目标对象归类至多个聚类簇中。
[0020]在一种实现方式中,第i个目标对象的对象特征的数量为M个,M为正整数;处理单元,用于根据P个目标对象的对象特征以及P个目标对象的访问信息,构建P个目标对象的聚类特征向量时,具体用于执行如下步骤:
[0021]分别对第i个目标对象的M个对象特征进行向量化处理,得到第i个目标对象的M个对象特征向量;
[0022]对第i个目标对象的访问信息进行向量化处理,得到第i个目标对象的访问向量;
[0023]根据第i个目标对象的M个对象特征向量和第i个目标对象的访问向量,构建第i个目标对象的聚类特征向量。
[0024]在一种实现方式中,处理单元,用于根据第i个目标对象的M个对象特征向量和第i个目标对象的访问向量,构建第i个目标对象的聚类特征向量时,具体用于执行如下步骤:
[0025]对第i个目标对象的M个对象特征进行特征分类,根据第i个目标对象的M个对象特征中属于同一特征类型的对象特征所对应的对象特征向量,构建第i个目标对象的一个聚类特征向量;根据第i个目标对象的访问向量构建第i个目标对象的一个聚类特征向量;
[0026]或者,根据第i个目标对象的一个对象特征向量构建第i个目标对象的一个聚类特征向量;根据第i个目标对象的访问向量构建第i个目标对象的一个聚类特征向量。
[0027]在一种实现方式中,处理单元,还用于执行如下步骤:
[0028]对第i个目标对象的M个对象特征向量进行筛选,得到第i个目标对象筛选后的对象特征向量;
[0029]处理单元,用于根据第i个目标对象的M个对象特征向量和第i个目标对象的访问向量,构建第i个目标对象的聚类特征向量时,具体用于执行如下步骤:
[0030]根据筛选后的对象特征向量和第i个目标对象的访问向量,构建第i个目标对象的聚类特征向量。
[0031]在一种实现方式中,P个目标对象中的任一个目标对象的对象特征的数量为M个;M个对象特征中的任一个对象特征表示为第j个对象特征,j为小于或等于M的正整数;
[0032]处理单元,用于对第i个目标对象的M个对象特征向量进行筛选,得到第i个目标对
象筛选后的对象特征向量时,具体用于执行如下步骤:
[0033]获取P个目标对象在第j个对象特征下的P个对象特征向量;
[0034]基于P个对象特征向量,计算第j个对象特征的方差;
[0035]若方差大于或等于方差阈值,则将第i个目标对象在第j个对象特征下的对象特征向量确定为筛选后的对象特征向量。
[0036]在一种实现方式中,P个目标对象中的任一个目标对象的对象特征的数量为M个;M个对象特征中的任一个对象特征表示为第j个对象特征,j为小于或等于M的正整数;
[0037]处理单元,用于对第i个目标对象的M个对象特征向量进行筛选,得到第i个目标对象筛选后的对象特征向量时,具体用于执行如下步骤:
[0038]获取P个目标对象在第j个对象特征下P个对象特征向量,以及获取P个目标对象在其他对象特征下的对象特征向量;其他对象特征是指M个对象特征中除第j个对象本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取P个目标对象的属性数据和目标数据;所述P个目标对象中的第i个目标对象的目标数据包括所述第i个目标对象在时间周期内针对目标业务的多个访问数据,P为大于或等于2的整数,i为小于或等于P的正整数;根据所述P个目标对象的属性数据,构建所述P个目标对象的对象特征;对所述P个目标对象的目标数据进行基于序列模式的挖掘分析,得到所述P个目标对象的访问信息;根据所述P个目标对象的对象特征以及所述P个目标对象的访问信息,对所述P个目标对象进行集成聚类处理,得到多个聚类簇;每个所述聚类簇中包含所述P个目标对象中的至少一个目标对象;根据每个所述聚类簇中的对象类型,确定各个聚类簇的分类类型。2.如权利要求1所述的方法,其特征在于,所述第i个目标对象的访问信息用于反映所述第i个目标对象在所述时间周期内针对所述目标业务的多个访问数据之间的共性信息;所述根据所述P个目标对象的对象特征以及所述P个目标对象的访问信息,对所述P个目标对象进行集成聚类处理,得到多个聚类簇,包括:根据所述P个目标对象的对象特征以及所述P个目标对象的访问信息,构建所述P个目标对象的聚类特征向量;根据至少一种聚类算法以及所述P个目标对象的聚类特征向量,对所述P个目标对象进行聚类处理,得到多个聚类结果,每个聚类结果指示所述P个目标对象的一种聚类策略;调用一致性函数从所述多个聚类结果中确定一致性聚类结果,并根据所述一致性聚类结果所指示的聚类策略将所述P个目标对象归类至所述多个聚类簇中。3.如权利要求2所述的方法,其特征在于,所述第i个目标对象的对象特征的数量为M个,M为正整数;所述根据所述P个目标对象的对象特征以及所述P个目标对象的访问信息,构建所述P个目标对象的聚类特征向量,包括:分别对所述第i个目标对象的M个对象特征进行向量化处理,得到所述第i个目标对象的M个对象特征向量;对所述第i个目标对象的访问信息进行向量化处理,得到所述第i个目标对象的访问向量;根据所述第i个目标对象的M个对象特征向量和所述第i个目标对象的访问向量,构建所述第i个目标对象的聚类特征向量。4.如权利要求3所述的方法,其特征在于,所述根据所述第i个目标对象的M个对象特征向量和所述第i个目标对象的访问向量,构建所述第i个目标对象的聚类特征向量,包括:对所述第i个目标对象的M个对象特征进行特征分类,根据所述第i个目标对象的M个对象特征中属于同一特征类型的对象特征所对应的对象特征向量,构建所述第i个目标对象的一个聚类特征向量;根据所述第i个目标对象的访问向量构建所述第i个目标对象的一个聚类特征向量;或者,根据所述第i个目标对象的一个对象特征向量构建所述第i个目标对象的一个聚类特征向量;根据所述第i个目标对象的访问向量构建所述第i个目标对象的一个聚类特征向量。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:对所述第i个目标对象的M个对象特征向量进行筛选,得到所述第i个目标对象筛选后的对象特征向量;所述根据所述第i个目标对象的M个对象特征向量和所述第i个目标对象的访问向量,构建所述第i个目标对象的聚类特征向量,包括:根据所述筛选后的对象特征向量和所述第i个目标对象的访问向量,构建所述第i个目标对象的聚类特征向量。6.如权利要求5所述的方法,其特征在于,所述P个目标对象中的任一个目标对象的对象特征的数量为M个;M个对象特征中的任一个对象特征表示为第j个对象特征,j为小于或等于M的正整数;所述对所述第i个目标对象的M个对象特征向量进行筛选,得到所述第i个目标对象筛选后的对象特征向量,包括:获取所述P个目标对象在所述第j个对象特征下的P个对象特征向量;基于所述P个对象特征向量,计算所述第j个对象特征的方差;若所述方差大于或等于方差阈值,则将所述第i个目标对象在所述第j个对象特征下的对象特征向量确定为所述筛选后的对象特征向量。7.如权利要求5所述的方法,其特征在于,所述P个目标对象中的任一个目标对象的对象特征的数量为M个;M个对象特征中的任一个对象特征表示为第j个对象特征,j为小于或等于M的正整数;所述对所述第i个目标对象的M个对象特征向量进行筛选,得到所述第i个目标对象筛选后的对象特征向量,包括:获取所述P个目标对象在所述第j个对象特征下P个对象特征向量,以及获取所述P个目标对象在其他对象特征下的对象特征向量;所述其他对象特征是...

【专利技术属性】
技术研发人员:刘志煌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1