用户隐性特征计算方法、服务器及计算机可读存储介质技术

技术编号:19342368 阅读:53 留言:0更新日期:2018-11-07 13:58
本发明专利技术公开了一种用户隐性特征计算方法,该方法包括:获取用户行为数据集;设置所需的用户隐性特征的数量;将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。本发明专利技术实施例还公开了一种服务器和计算机可读存储介质。由此,能够精确刻画用户的兴趣标签,从而为搜索、个性化推荐等业务提供数据支持。

User implicit characteristic calculation method, server and computer readable storage medium

The invention discloses a method for calculating user's implicit characteristics, which includes acquiring user's behavior data sets, setting the number of user's implicit features required, and taking the number as the classification number of LFM modeling, LFM modeling of the behavior data sets and obtaining corresponding number of implicit features. The embodiment of the invention also discloses a server and a computer readable storage medium. Thus, user interest tags can be accurately depicted to provide data support for search, personalized recommendation and other services.

【技术实现步骤摘要】
用户隐性特征计算方法、服务器及计算机可读存储介质
本专利技术涉及数据挖掘
,尤其涉及一种用户隐性特征计算方法、服务器及计算机可读存储介质。
技术介绍
随着互联网技术的快速发展,个性化服务越来越成为各个企业关注的重点,互联网个性化技术可以把用户的个性化需求与相关的个性化产品和服务整合起来,从而给用户进行更加精准的个性化推荐、搜索、广告等服务。互联网个性化服务的形态包括个性化商品推荐、个性化推送、个性化搜索等各个场景,通过相应的个性化技术,为不同的用户提供不同的服务。在各种个性化技术中比较重要的异步就是用户兴趣特征的挖掘和描述,即用户业务画像标签的挖掘。一般的用户业务画像标签的挖掘是通过用户使用的商品标签程度来刻画用户兴趣,但是往往商品标签的总数数量级为万或是数十万,单个用户往往也会达到千的级别。如果用标签总量来标示用户兴趣,则每个用户的兴趣向量维度可达上万维,其中由于与用户发生过交互的商品标签为百级、千级,则每个用户的兴趣向量大部分为0;如果每个用户仅标示最感兴趣的前n(例如n=100)个标签,则会丢失大量用户兴趣信息。
技术实现思路
本专利技术的主要目的在于提出一种用户隐性特征计算方法、服务器及计算机可读存储介质,以精确刻画用户的兴趣标签,从而为搜索、个性化推荐等业务提供数据支持。为实现上述目的,本专利技术提供的一种用户隐性特征计算方法,所述方法包括步骤:获取用户行为数据集;设置所需的用户隐性特征的数量;及将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。可选地,所述方法还包括步骤:利用所述隐性特征进行用户聚类分析。可选地,所述方法还包括步骤:将所述隐性特征作为补充特征进行CTR预估。可选地,所述用户行为数据集中包括一个终端应用的所有用户和所有项目,以及每个用户有过行为的项目列表。可选地,对所述行为数据集进行LFM建模,得到对应数量的隐性特征的步骤包括:根据所述数量,将所述行为数据集对应的R矩阵分解为用户特征矩阵P矩阵和项目特征矩阵Q矩阵,所述P矩阵中各项值Pi,j表示用户useri对分类classj的兴趣度,所述Q矩阵中各项值Qi,j表示项目itemj属于分类classi的权重,其中所述分类即为所述隐性特征。此外,为实现上述目的,本专利技术还提出一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户隐性特征计算程序,所述用户隐性特征计算程序被所述处理器执行时实现如下步骤:获取用户行为数据集;设置所需的用户隐性特征的数量;及将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。可选地,所述用户隐性特征计算程序被所述处理器执行时还实现步骤:利用所述隐性特征进行用户聚类分析。可选地,所述用户隐性特征计算程序被所述处理器执行时还实现步骤:将所述隐性特征作为补充特征进行CTR预估。可选地,所述对所述行为数据集进行LFM建模,得到对应数量的隐性特征的步骤包括:根据所述数量,将所述行为数据集对应的R矩阵分解为用户特征矩阵P矩阵和项目特征矩阵Q矩阵,所述P矩阵中各项值Pi,j表示用户useri对分类classj的兴趣度,所述Q矩阵中各项值Qi,j表示项目itemj属于分类classi的权重,其中所述分类即为所述隐性特征。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有用户隐性特征计算程序,所述用户隐性特征计算程序被处理器执行时实现如上述的用户隐性特征计算方法的步骤。本专利技术提出的用户隐性特征计算方法、服务器及计算机可读存储介质,能够利用大量用户的终端APP使用行为进行用户隐性特征挖掘,得到用户的兴趣属于各个隐性特征的权重,即用户的隐性特征向量,利用此向量,可以精确刻画用户的兴趣标签,从而为搜索、个性化推荐等业务提供数据支持。附图说明图1为实现本专利技术各个实施例的一种应用环境架构图;图2为本专利技术中一种移动终端的硬件结构示意图;图3为如图2所示的移动终端的无线通信系统示意图;图4为本专利技术第一实施例提出的一种用户隐性特征计算方法的流程图;图5为本专利技术中LFM建模的示意图;图6为本专利技术第二实施例提出的一种用户隐性特征计算方法的流程图;图7为本专利技术第三实施例提出的一种用户隐性特征计算方法的流程图;图8为本专利技术第四实施例提出的一种服务器的模块示意图;图9为本专利技术第五实施例提出的一种用户隐性特征计算系统的模块示意图;图10为本专利技术第六实施例提出的一种用户隐性特征计算系统的模块示意图;图11为本专利技术第七实施例提出的一种用户隐性特征计算系统的模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。请参阅图1,图1为实现本专利技术各个实施例的一种应用环境架构图。本专利技术可应用于包括,但不仅限于,服务器2、终端4、网络6的应用环境中。其中,所述服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该服务器2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。所述终端4可以以各种形式来实施。例如,本专利技术中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(PersonalDigitalAssistant,PDA)、便捷式媒体播放器(PortableMediaPlayer,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本专利技术的实施方式的构造也能够应用于固定类型的终端。所述网络6可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(GlobalSystemofMobilecommunication,GSM)、宽带码分多址(WidebandCodeDivisionMultipleAccess,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。所述服务器2通过所述网络6分别与一个或多个所述终端4通信连接,以进行数据传输和交互。请参阅图2,其为本专利技术中一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(RadioFrequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图2中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。下面结合图2对移动终端的各个部件进行具体的介绍:射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上本文档来自技高网...

【技术保护点】
1.一种用户隐性特征计算方法,应用于服务器中,其特征在于,所述方法包括步骤:获取用户行为数据集;设置所需的用户隐性特征的数量;及将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。

【技术特征摘要】
1.一种用户隐性特征计算方法,应用于服务器中,其特征在于,所述方法包括步骤:获取用户行为数据集;设置所需的用户隐性特征的数量;及将所述数量作为LFM建模的分类数,对所述行为数据集进行LFM建模,得到对应数量的隐性特征。2.根据权利要求1所述的用户隐性特征计算方法,其特征在于,所述方法还包括步骤:利用所述隐性特征进行用户聚类分析。3.根据权利要求1所述的用户隐性特征计算方法,其特征在于,所述方法还包括步骤:将所述隐性特征作为补充特征进行CTR预估。4.根据权利要求1-3任一项所述的用户隐性特征计算方法,其特征在于,所述用户行为数据集中包括一个终端应用的所有用户和所有项目,以及每个用户有过行为的项目列表。5.根据权利要求1-3任一项所述的用户隐性特征计算方法,其特征在于,对所述行为数据集进行LFM建模,得到对应数量的隐性特征的步骤包括:根据所述数量,将所述行为数据集对应的R矩阵分解为用户特征矩阵P矩阵和项目特征矩阵Q矩阵,所述P矩阵中各项值Pi,j表示用户useri对分类classj的兴趣度,所述Q矩阵中各项值Qi,j表示项目itemj属于分类classi的权重,其中所述分类即为所述隐性特征。6.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在...

【专利技术属性】
技术研发人员:邱孝童
申请(专利权)人:努比亚技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1