一种匿名推荐装置和方法制造方法及图纸

技术编号:31632857 阅读:16 留言:0更新日期:2021-12-29 19:12
本发明专利技术公开一种匿名推荐装置和方法,其中,匿名推荐装置包括:表征模块用以分析用户行为数据,得到用户行为相关的网页特征向量集;第一特征拼接模块用以将网页特征向量集进行拼接,得到原始特征集;第一特征抽取模块用以对原始特征集进行分析获得第一组特征向量集;第二特征抽取模块用以对原始特征集进行分析获得第二组特征向量集;第二特征拼接模块用以将原始特征集、第一组特征向量集、第二组特征向量集进行拼接得到行为特征集;排序模块用以对行为特征集进行评分排序,得到预测结果。本发明专利技术基于用户上网行为如搜索行为,阅读文章,点击的商品,收藏店铺进行分析和预测,能提高匿名推荐的准确率。高匿名推荐的准确率。高匿名推荐的准确率。

【技术实现步骤摘要】
一种匿名推荐装置和方法


[0001]本专利技术涉及人工智能处理领域,尤其涉及一种匿名推荐装置和方法。

技术介绍

[0002]传统的推荐技术都基于用户的画像数据进行分析,而要构建用户的画像则需要采集用户的各种信息包括用户的ID、年龄、生日、电话号码等等隐私信息,并基于用户的各种隐私信息来进行分析之后获得用户画像,再根据用户画像的特征以及行为进行推荐相关的信息或者产品,可以大大提升了推荐的准确率。
[0003]但随着用户信息安全的隐患越来越多,隐私安全越来越受到重视,涉及用户隐私的信息不再提供,因此现有的推荐算法在缺乏了用户的隐私信息的情况下,其推荐的准确率受到了很大的影响。

技术实现思路

[0004]本专利技术为解决现有技术中存在的上述缺陷,提出一种匿名推荐装置和方法,该装置和方法不需要用户的画像数据,只根据用户的行为进行匿名推荐。
[0005]为了实现以上目的,本专利技术提出了一种匿名推荐装置,包括表征模块、第一特征拼接模块、第一特征抽取模块、第二特征抽取模块、第二特征拼接模块、排序模块,其中:
[0006]表征模块用以分析用户行为数据,得到用户行为相关的网页特征向量集;
[0007]第一特征拼接模块用以将网页特征向量集进行拼接,得到原始特征集;
[0008]第一特征抽取模块用以对原始特征集进行分析获得第一组特征向量集;
[0009]第二特征抽取模块用以对原始特征集进行分析获得第二组特征向量集;
[0010]第二特征拼接模块用以将原始特征集、第一组特征向量集、第二组特征向量集进行拼接得到行为特征集;
[0011]排序模块用以对行为特征集进行评分排序,得到预测结果。
[0012]进一步地,所述用户行为数据包括用户点击网址列表。
[0013]进一步地,所述行为特征向量集包括离散特征向量集和连续特征向量集。
[0014]进一步地,所述的连续特征向量集包括时间戳、阅读人数。
[0015]进一步地,所述的所述的离散特征向量集包括网页标签。
[0016]进一步地,所述第一特征抽取模块采用包含12层的transformer网络结构的BERT模型实现。
[0017]进一步的,所述第二特征抽取模块采用3层卷积神经网络实现。
[0018]进一步的,所述排序模块采用softplus损失函数实现。
[0019]本专利技术还公开一种匿名推荐方法,应用于匿名推荐装置,其步骤包括:
[0020]获取的用户的行为数据;
[0021]对用户的行为数据进行分析,得到用户行为相关的网页特征向量集;
[0022]将网页特征向量集进行拼接,得到原始特征集;
[0023]对原始特征集进行分析获得第一组特征向量集、第二组特征向量集;
[0024]将原始特征集、第一组特征向量集、第二组特征向量集进行拼接得到行为特征集;
[0025]对行为特征集进行评分排序,得到预测结果;
[0026]所述的匿名推荐装置为所述的匿名推荐装置。
[0027]本专利技术还公开一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行所述匿名推荐方法。
[0028]本专利技术还公开一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行所述匿名推荐方法。
[0029]本专利技术公开的方法和系统中所述模块,在实际应用中,即可以在一台目标服务器上部署多个模块,也可以每一模块独立部署在不同的目标服务器上,特别的,根据需要,为了提供更强大的计算处理能力,也可以根据需要将模块部署到集群目标服务器上。
[0030]由此可见,本专利技术的匿名推荐装置不需要用户的画像数据,只需要分析和挖掘用户的行为进行匿名推荐,本专利技术支持的用户行为包括但不限于搜索行为,阅读文章,点击的商品,收藏店铺等,。
[0031]为了对本专利技术有更清楚全面的了解,下面结合附图,对本专利技术的具体实施方式进行详细描述。
附图说明
[0032]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请实施例的一种匿名推荐装置的结构示意图。
[0034]其中:表征模块1、第一特征拼接模块2、第一特征抽取模块3、第二特征抽取模块4、第二特征拼接模块5、排序模块6。
具体实施方式
[0035]请参阅图1,图1示出了一种匿名推荐装置的结构示意图。
[0036]本申请的一种匿名推荐装置,读入用户行为数据,获取用户行为数据的特征向量,然后分别经过特征拼接处理和特征分析处理,再通过损失函数进行评分和排序,得分前面的为预测输出。
[0037]作为一种实施方式,本申请实施例的匿名推荐装置包括表征模块、第一特征拼接模块、第一特征抽取模块、第二特征抽取模块、第二特征拼接模块、排序模块,其中:
[0038]表征模块用以分析用户行为数据,得到用户行为相关的网页特征向量集;
[0039]第一特征拼接模块用以将网页特征向量集进行拼接,得到原始特征集;
[0040]第一特征抽取模块用以对原始特征集进行分析获得第一组特征向量集;
[0041]第二特征抽取模块用以对原始特征集进行分析获得第二组特征向量集;
[0042]第二特征拼接模块用以将原始特征集、第一组特征向量集、第二组特征向量集进
行拼接得到行为特征集;
[0043]排序模块用以对行为特征集进行评分排序,得到预测结果。
[0044]作为一种优选的实施方式,本申请实施例分析的用户行为数据包括用户点击网址列表。
[0045]具体的,首先记录用户在一段时间内点击的所有网页,然后对网页记录进行分类处理,得到正样本集和负样本集。作为一种举例,匿名用户记录他在某一个时间段内,点击网站列表格式如下:
[0046]匿名User1:web1,web2,web3,web4,web5
[0047]处理成正样本标签数据形式如下:
[0048]输入:web1;标签:web2
[0049]输入:web1,web2;标签:web3
[0050]输入:web1,web2,web3;标签:web4
[0051]输入:web1,web2,web3,web4;标签:web5
[0052]处理成负样本标签数据形式如下:
[0053]输入:web1;标签:web100
[0054]输入:web1,web2;标签:web101
[0055]输入:web1,web2,web3;标签:web102
[0056]输入:web1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种匿名推荐装置,其特征是,包括表征模块、第一特征拼接模块、第一特征抽取模块、第二特征抽取模块、第二特征拼接模块、排序模块,其中:表征模块用以分析用户行为数据,得到用户行为相关的网页特征向量集;第一特征拼接模块用以将网页特征向量集进行拼接,得到原始特征集;第一特征抽取模块用以对原始特征集进行分析获得第一组特征向量集;第二特征抽取模块用以对原始特征集进行分析获得第二组特征向量集;第二特征拼接模块用以将原始特征集、第一组特征向量集、第二组特征向量集进行拼接得到行为特征集;排序模块用以对行为特征集进行评分排序,得到预测结果。2.如权利要求1所述的装置,其特征是,所述用户行为数据包括用户点击网址列表。3.如权利要求1所述的装置,其特征是,所述网页特征向量集包括离散特征向量集和连续特征向量集。4.如权利要求3所述的装置,其特征是,所述的连续特征向量集包括时间戳、阅读人数。5.如权利要求3所述的装置,其特征是,所述的离散特征向量集包括网页标签。6.如权利要求1所述的装置,其特征是,所述第一特征抽取模块采用包含12层的transformer网络结构的BERT模型实现。7....

【专利技术属性】
技术研发人员:曾祥云朱姬渊
申请(专利权)人:上海大参林医疗健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1