【技术实现步骤摘要】
一种智能推荐方法、装置、计算机设备及可读存储介质
本专利技术涉及大数据的数据分析
,尤其涉及一种智能推荐方法、装置、计算机设备及可读存储介质。
技术介绍
推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。当前的推荐算法或采用基于标签映射的方式对用户端进行产品推荐,或采用基于贝叶斯方法对用户端进行产品推荐。但是,专利技术人意识到,当前的推荐算法在面对少量数据时,可以无压力运行,但一旦面对海量用户数据时,该推荐算法将会因计算复杂,数据量庞大等原因,导致运行缓慢,服务器压力增大,进而导致推荐信息难以快速有效获得。
技术实现思路
本专利技术的目的是提供一种智能推荐方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的在面对海量用户数据时,当前的推荐算法将会因计算复杂,数据量庞大等原因,导致运行缓慢,服务器压力增大,进而导致推荐信息难以快速有效获得问题。为实现上述目的,本专利技术提供一种智能推荐方法,包括:获取用户信息,对所述用户信息进行特征化处理得到用户向量;调用乘积量化进程,用以将所述用户向量进行切分得到若干个子向量,及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合;调用最小哈希进程,用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对,并将相似度超过预置相似度阈值的参考类别 ...
【技术保护点】
1.一种智能推荐方法,其特征在于,包括:/n获取用户信息,对所述用户信息进行特征化处理得到用户向量;/n调用乘积量化进程,用以将所述用户向量进行切分得到若干个子向量,及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合;/n调用最小哈希进程,用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对,并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合;其中,所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的,用于反映该参考信息对应子向量的所属类别的数据集合,所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息;/n将目标类别集合对应的关联信息作为推荐信息。/n
【技术特征摘要】
1.一种智能推荐方法,其特征在于,包括:
获取用户信息,对所述用户信息进行特征化处理得到用户向量;
调用乘积量化进程,用以将所述用户向量进行切分得到若干个子向量,及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合;
调用最小哈希进程,用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对,并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合;其中,所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的,用于反映该参考信息对应子向量的所属类别的数据集合,所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息;
将目标类别集合对应的关联信息作为推荐信息。
2.根据权利要求1所述的智能推荐方法,其特征在于,所述获取用户信息的步骤之前,所述方法还包括:
识别用户端,从数据库中获取与所述用户端对应的用户基本信息,通过埋点采集所述用户端的行为得到对应的用户行为信息,从所述用户端发送的对话文本中提取得到用户对话信息,汇总所述用户基本信息、用户行为信息和用户对话信息得到用户信息并将其保存至预设的用户数据库。
3.根据权利要求1所述的智能推荐方法,其特征在于,所述调用乘积量化进程,用以将所述用户向量进行切分得到若干个子向量,及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合的步骤,包括:
执行切分子进程,用以触发乘积量化算法将用户向量切分为预置数量的子向量;
执行量化子进程,用以触发乘积量化算法通过预置的子码书判断各子向量所属的聚类中心,并将该聚类中心对应的类型设为所述子向量的类型;
执行压缩子进程,用以触发乘积量化算法汇总各子向量的类型得到用户类别集合。
4.根据权利要求1所述的智能推荐方法,其特征在于,所述最小哈希进程,用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对,并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合的步骤,包括:
获取所述索引库中所有参考类别集合的参考索引值并去重得到综合索引值,汇总所述综合索引值得到综合类别集合;
将用户类别集合的用户索引值依次与所述综合类别集合的综合索引值进行一一比对,以得到反映用户索引值和综合索引值一致的相同值,和反映用户索引值和综合索引值不一致的不同值,汇总所述相同值和不同值得到反映用户类别集合与综合类别集合相似度的用户综合索引集合;
将参考类别集合的参考索引值依次与所述综合类别集合的综合索引值进行一一比对,得到反映参考索引值与综合索引值一致的相同值,和反映参考索引值与综合索引值不一致的不同值,汇总所述相同值和不同值得到反映参考类别集合与综合类别集合相似度的参考综合索引集合;
汇总所述用户综合索引集合和参考综合索引集合得到用户参考索引集合;
调用预置的哈希函数对所述用户参考索引集合的行数进行计算,使所述用户参考索引集合的各行分别得到对应的哈希值;
获取具有用户综合索引集合名称及参考综合索引集合名称的初始签名矩阵,依次识别用户参考索引集合中各行元素值为相同值所对应用户综合索引集合和/或参考综合索引集合,及该行所对应的哈希值;将所述哈希值设为目标值并将其加载至所述初始签名矩阵中...
【专利技术属性】
技术研发人员:王浩,刘丹,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。