一种相似用户识别方法及装置制造方法及图纸

技术编号：13175289 阅读：68 留言：0更新日期：2016-05-10 18:39

本发明专利技术公开了一种相似用户识别方法及装置，该方法包括：采集当前用户的用户信息以及状态信息；通过所述用户信息以及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值，所述特性因子为满足预设数据规则的标签信息；将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。本发明专利技术提供了一种通过特性因子的权重关系对当前用户以及目标用户进行比较，得到二者相似度的方法及装置，与现有技术相比，本申请所提供的方法及装置效率较高、识别准确度较高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据挖掘
，特别是涉及一种相似用户识别方法及装置。
技术介绍
随着信息技术的发展，互联网、移动互联网、物联网能够收集到越来越多的用户信息，如何将这些信息采集、存储并分析，进而发现不同用户之间的相似性正在成为研究热点。然而，现有技术中对相似用户识别的方法存在着计算复杂度高、效率低、准确度低的缺点。鉴于此，本专利技术提供了一种相似用户识别方法及装置，以使得对用户进行相似度分析的过程效率更高、识别准确度更高。
技术实现思路
本专利技术的目的是提供一种相似用户识别方法及装置，以解决现有技术中对相似用户进行识别的过程效率低以及准确度低的问题。为解决上述技术问题，本专利技术提供一种相似用户识别方法，包括:采集当前用户的用户信息以及状态信息；通过所述用户信息以及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值，所述特性因子为满足预设数据规则的标签信息；将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。可选地，所述分别确定所述当前用户的各特性因子对应的当前权重数值包括:根据预设规则对预设周期内的数值进行筛选，选取的数值作为所述当前用户的各特性因子对应的当前权重数值。可选地，所述采集当前用户的用户信息以及状态信息包括:通过数据适配器周期性采集可穿戴设备、机器爬虫程序或人工手动输入的当前用户的用户信息以及状态信息。可选地，在采集当前用户的用户信息以及状态信息之后还包括:将所述用户信息以及所述状态信息转换为预设格式的数据；...

【技术保护点】
一种相似用户识别方法，其特征在于，包括：采集当前用户的用户信息以及状态信息；通过所述用户信息以及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值，所述特性因子为满足预设数据规则的标签信息；将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘文义，柳鹏，
申请(专利权)人：山东金佳园科技股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人