活动参与分析及推荐方法技术

技术编号:21434439 阅读:19 留言:0更新日期:2019-06-22 12:36
本发明专利技术公开了一种活动参与分析及推荐方法,通过引入双向选择建模,可以更为真实地还原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐的性能,实现一举多得的效果。

【技术实现步骤摘要】
活动参与分析及推荐方法
本专利技术涉及数据挖掘中的社交用户行为分析领域,尤其涉及一种活动参与分析及推荐方法。
技术介绍
社交网络的发展促进了社交元素与新兴商业模式的深度融合,传统的熟人社交逐渐拓展为基于兴趣主题的陌生人社交,并进而衍生出面向特定主题的线下聚会及所谓“由事件驱动的社交网络”。借助这一社交媒介,活动组织者可以便捷地发布与活动相关的介绍并邀请潜在的参与者。而用户(参与者)则往往根据主题、时间、地点、社交影响等因素综合考虑决定是否参加活动。由于用户与活动数量的飞速增长,如何有效地协助用户找到感兴趣的活动,同时帮助活动组织者成功聚集目标参与者,已成为社交活动平台所急需解决的重要任务。目前,围绕社交活动中的用户画像与活动推荐,已有诸多相关的技术方案与研究成果,部分代表性的公开技术包括:CN201610781795.3,一种移动社交网络中的社交活动推荐算法,主要根据用户与活动之间的标签、地理、好友等相似度来进行活动推荐。CN201710423237.4,一种资源受限约束下的活动推荐方法及系统,基于推荐成本与营销成本的约束,将活动推荐转化为一个优化问题并加以求解。CN201711224583.6,一种活动社交网络用户参加活动推荐的多因素决策方法,根据活动属性与用户的社交影响力,及内容、地点、时间相关性等诸多因素,采用经典的J48决策树算法,实现活动推荐。然而,现有技术存在一个严重的缺陷,即往往仅考虑活动中的一方(多为作为参与者的用户)所做的选择,而另一方仅止于被动接受。在传统推荐问题中,由于其中一方在名额上可视作无限制(如商品的可销售件数或电影的可容纳观众数),这种被动接受现象有其合理性。但对于活动推荐问题而言,组织方受限于场地或活动规模,而参与者受限于时间或精力,因此双方都不可能无限制地接受对方。在这种情况下,双方都具有较强的主动性去根据一定的标准去进行筛选,从而形成了所谓“双向选择”的过程。对于这一过程的建模及其衍生出的“稳定匹配”问题的求解,虽然目前已有包括经典的Gale-Shapley算法在内的大量研究成果,但这些技术依赖于显性的对于对方的完整排序。然而在现实世界中,排序甚至作为排序依据的用户画像都往往以隐性方式存在,需要从大量的历史行为数据中加以揭示和归纳。
技术实现思路
本专利技术的目的是提供一种活动参与分析及推荐方法,通过建模活动组织者与参与者双方的双向选择过程,更加真实地还原双方在活动过程中的决策,同时解决参与预测与活动推荐两项任务并提升其效果。本专利技术的目的是通过以下技术方案实现的:(与权利要求相对应)。由上述本专利技术提供的技术方案可以看出,通过引入双向选择建模,可以更为真实地还原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐的性能,实现一举多得的效果。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的一种活动参与分析及推荐方法的流程图;图2为本专利技术实施例提供的模型训练与参数估计流程图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例一种活动参与分析及推荐方法,如图1所示,其主要包括如下步骤:步骤1、从活动组织者与参与者的历史行为记录中获取用于分析的基本数据。步骤2、基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练。步骤3、对于新组织的活动,基于活动自身信息、以及完成参数训练的决策函数,计算双方对于对方每个成员的评分,进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。上述方案中,通过引入双向选择建模,可以更为真实地还原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐的性能,实现一举多得的效果。为了便于理解,下面针对上述三个步骤的优选实施方式进行介绍。1、基本数据的收集、筛选及预处理。1)基本数据的收集。本专利技术实施例中,所述基本数据至少包括:历史活动信息以及活动组织者与参与者各自的画像信息;其中,历史活动信息包括:活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录(是否参见活动、活动后的评价或评分)等;所述活动属性包括:活动时间、地点及费用等。活动组织者与参与者各自的画像信息包括:活动组织者对应的领导人或者发起人、活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系等。2)数据筛选。由于需要还原活动组织者与参与者之间的双向选择过程,因此,需要为双方,尤其是参与方(用户)提供一定的选择空间。根据这一需求,对获得的基本数据进行数据筛选,数据筛选时设置了两项阈值。第一项阈值,用于确保所筛选出的多个活动中,每一活动的潜在参与者之间存在一定的重叠,所述潜在参与者是指被邀请的参与者;重叠的人数或比例需要根据预设的阈值加以筛选。一般而言,阈值需要根据历史活动的规模与用户的重叠程度来决定。较高的阈值可以保证活动之间有更多的重叠,从而使得某一组中有更为丰富的用户量可供分析,双向选择建模的优势也更明显。但是同时,较高的阈值也会导致符合要求的活动组较少,从而导致覆盖的用户群较为有限。因此,阈值需要在综合考虑上述两种因素的基础之上进行设定。在本专利技术实施例中,可以将阈值设定为两两活动之间必须具有10%以上的重叠用户。第二项阈值,用于确保活动组织者与参与者均具有一定数量的历史活动记录,从而保证参与者画像的精度,在本专利技术实施例中,对于这项阈值并不做额外要求。3)数据预处理。无论是历史活动信息还是活动参与双方的介绍,都包含丰富的文本信息。对筛选出的数据进行预处理时,将相应的文本信息进行向量化处理,以便于进行后续分析,并去除文本信息中的停用词,以免对文本信息向量化处理造成干扰。本专利技术实施例中,可以采用LatentDirichletAllocation模型,并基于公开的停用词表筛去部分停用词。2、模型训练与参数估计。如图2所示,模型训练与参数估计步骤主要包括5个环节。其中,②和④分别对应外层(双向匹配优化)和内层(参数迭代优化)两个优化过程,而①、③、⑤分别对应着参数初始化、计算损失函数和排序更新。接下来将详细介绍每个步骤的定义及实施方式。①参数初始化。在本环节中,对活动组织者与参与者各自对于对方的评价因素进行参数初始化,所涉及的评价因素也即决策函数中的相关参数;并结合初始化后的评价因素与决策函数,初步得到活动组织者所组织的活动和参与者对于对方的完整排序列表,以支撑②中的外本文档来自技高网
...

【技术保护点】
1.一种活动参与分析及推荐方法,其特征在于,包括:从活动组织者与参与者的历史行为记录中获取用于分析的基本数据;基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练;对于新组织的活动,基于活动自身信息、以及完成参数训练的决策函数,计算双方对于对方每个成员的评分,进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。

【技术特征摘要】
1.一种活动参与分析及推荐方法,其特征在于,包括:从活动组织者与参与者的历史行为记录中获取用于分析的基本数据;基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练;对于新组织的活动,基于活动自身信息、以及完成参数训练的决策函数,计算双方对于对方每个成员的评分,进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。2.根据权利要求1所述的一种活动参与分析及推荐方法,其特征在于,所述基本数据至少包括:历史活动信息以及活动组织者与参与者各自的画像信息;其中,历史活动信息包括:活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录;所述活动属性包括:活动时间、地点及费用;活动组织者与参与者各自的画像信息包括:活动组织者对应的领导人或者发起人、活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系。3.根据权利要求1或2所述的一种活动参与分析及推荐方法,其特征在于,该方法还包括:对获得的基本数据进行数据筛选,数据筛选时设置了两项阈值,第一项阈值,用于确保所筛选出的多个活动中,每一活动的潜在参与者之间存在一定的重叠,所述潜在参与者是指被邀请的参与者;第二项阈值,用于确保活动组织者与参与者均具有一定数量的历史活动记录;之后,对筛选出的数据进行预处理;先去除文本信息中的提用词,再对文本信息进行向量化处理。4.根据权利要求1或2所述的一种活动参与分析及推荐方法,其特征在于,所述基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练包括如下五个环节:①参数初始化:此环节对活动组织者与参与者各自对于对方的评价因素进行参数初始化,所涉及的评价因素也即决策函数中的相关参数;结合初始化后的评价因素与决策函数得到活动组织者所组织的活动和参与者对于对方的完整排序列表;②双向稳定匹配:利用得到的活动组织者所组织的活动和参与者对于对方的完整排序列表,通过一对多Gale-Shapley算法,实现双方的稳定匹配,从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测;③计算损失函数:基于活动组织者和参与者之间的双向稳定匹配结果,结合活动记录中的邀请发放与参与者的参与记录,找出预测中所出现的错误,从而计算损失函数;④参数迭代优化:利用损失函数并借此更新活动或参与者的决策函数中相关参数;⑤排序更新:利用参数迭代优化结果,结合决策函数更新活动组织者所组织的活动和参与者对于对方的完整排序列表,并重新进入双向稳定匹配环节进行循环优化,直至活动组织者所组织的活动和参与者对于对方的完整排序列表不再改变。5.根据权利要求4所述的一种活动参与分析及推荐方法,其特征在于,对于活动组织者而言,其对参与者的评价因素包括:参与者ui的兴趣向量与活动组织者gj所组织的活动ejk的主题向量的相似性,以及参与者的影响力,其中参与者的影响力采用参与者在社交网络中的PageRank值加以近似估计,则活动组织者gj对于参与者ui的决策函数表示为:其中,表示活动ejk对参与者ui的评分,评分大小决定排序列表中相应参与者的位置;cos<.>表示余弦相似度函数,pagerank(W)[i]表示指参与者ui在社交网络中的PageRank值;对于参与者而言,其对活动组织者的评价因素包括:参与者ui的兴趣向量与活动ejk的主题向量的相似性,参与者ui对活动ejk所属活动组织者gj的忠诚度hij、以及来自社交好友的态度影响,则参与者ui对于活动组织者gj的决策函数表示为:其中,表示参与者ui对活动ejk的评分,评分大小决定排序列表中相应活动的位置;;表示对于参与者ui而言来自社交好友的态度影响,W={wir}为参与者ui与参与者ur之间的社交关系强度,用于构建参与者之间的社交网络,并实现PageRank值与参与者的影响力两个部分的计算;表示参与者ui想要参加活动ejk的好友集合;各评价因素初始化方式如下:参与者ui的兴趣向量与活动ejk的主题向量的相似性的初始化,依赖于参与者ui的自我介绍或活动ejk的相关文本描述,采用话题模型技术,对活动ejk的相关文本描述进行学习并生成若干潜在主题,进而将所有文本转化为对应的主题向量;如果参与者ui没有自我介绍或活动ejk没有相关文本描述,则将所有的主题向量设为均值,即每一维均为1/N,其中,N为潜在主题个数;参与者ui与参与者ur之间的社交关系强度W={wir}的初始化方法为,参与者ui与参与者ur共同参加过的活动数量sumir除以参与者ui参加过的活动的数量sumi:P...

【专利技术属性】
技术研发人员:徐童殷子凯陈恩红熊辉
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1