一种基于用户画像的活动推荐方法及装置制造方法及图纸

技术编号:21714504 阅读:30 留言:0更新日期:2019-07-27 19:14
本发明专利技术公开了一种基于用户画像的活动推荐方法,该方法包括:对文化行业进行分类,形成分类分词模型,并进行存储;对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并进行存储;对新数据信息进行预处理后,得到多个分词标签,并将所述分词标签进行临时存储;将所述分词标签与所述分类分词模型中的元素进行匹配,得到所述分类分词模型中的对应分类;对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,从而确定可参见所述新发布活动的用户群,并对所述新活动进行推送。本发明专利技术通过分析使用用户的属性特征和行为习惯,利用多叉树形成了用户画像,提高针对个人的文化活动内容推荐的精准度。

A Method and Device of Activity Recommendation Based on User Portrait

【技术实现步骤摘要】
一种基于用户画像的活动推荐方法及装置
本专利技术涉及活动推荐方法及系统,具体涉及一种基于用户画像的活动推荐方法及装置。
技术介绍
普通百姓预约和参加文化活动,都是在各种文化活动机构比如文化馆、图书馆等的网站平台进行自行搜索,效率低下;再此基础上,有人推出了用户推荐的专题功能,然而这种推荐大多数是后台编辑人员根据自己的喜好和认知进行的,精准度不高,用户采用率不高。
技术实现思路
专利技术目的:为了克服现有技术的不足,本专利技术提供一种基于用户画像的活动推荐方法,该方法可以解决现有技术中广告式推荐导致的精准率不高和效率低的问题,本专利技术还提供一种基于用户画像的活动推荐装置。技术方案:本专利技术所述的基于用户画像的活动推荐方法,该方法包括:(1)对文化行业进行分类,形成分类分词模型,并进行存储;(2)对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并存储到临时集合中;(3)对新数据信息进行预处理后,得到多个分词标签,并将所述分词标签进行临时存储;(4)将所述分词标签与所述分类分词模型中的元素进行匹配,得到所述分类分词模型中的对应分类;(5)对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,从而确定可参见所述新发布活动的用户群,并对所述新活动进行推送。优选的,步骤(1)中,所述分类分词模型包括地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合。优选的,所述用户画像为包括深度为n的多叉树,所述多叉树的每个节点根据节点信息(父节点ID,节点ID,节点名称)进行存储,并采用深度优先进行遍历查找。优选的,所述步骤(4)中,将所述目标词组与所述分类分词模型中的节点信息进行匹配包括:首先,分别读取每个分词标签,分别查找地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合中的所有元素,若存在与所述分词标签相同的元素,则存储该元素以及该元素对应的集合分类名称,若不存在与所述分词标签相同的元素,则判断是否为时间属性或地名属性的标签,若是时间属性或者地名属性,则存储该标签,否则不存储;其次,将所有分词标签查找后存储的所有元素记为匹配标签G[g1,g2,...,gu],u为最后一个分词标签存储后的元素的数量。优选的,所述步骤(5)中,对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,包括将所述匹配标签中的每个元素与所述多叉树中的节点信息进行模糊匹配,若存在两个及以上的匹配标签与节点信息匹配成功,则所述用户为被推送用户。另一方面,本专利技术还提供一种基于用户画像的活动推荐方法实现的装置,所述装置包括用户智能终端设备和服务器,所述服务器还包括第一存储模块、第一处理模块、第二存储模块、第二处理模块、第三存储模块、第三处理模块、第一匹配模块和第二匹配模块,所述第一处理模块用于对文化行业进行分类,形成分类分词模型,并存储到第一存储模块,所述第二处理模块所用于对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并存储到第二存储模块中;所述第三处理模块用于对新数据信息进行预处理后,得到多个分词标签,并将所述分词标签作为叶节点,以字典树的形式存储到第三存储模块中;第一匹配模块用于将所述分词标签与所述分类分词模型中的元素进行匹配,得到所述分类分词模型中的对应分类;第二匹配模块用于对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,从而确定可参见所述新发布活动的用户群,并对所述新活动推送到用户智能终端设备上。优选的,所述分类分词模型包括地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合。优选的,所述用户画像为包括深度为n的多叉树,所述多叉树的每个节点根据节点信息(父节点ID,节点ID,节点名称)进行存储,并采用深度优先进行遍历查找。优选的,所述第一匹配模块中,将所述目标词组与所述分类分词模型中的节点信息进行匹配包括:元素存储单元,分别读取每个分词标签,分别查找地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合中的所有元素,若存在与所述分词标签相同的元素,则存储该元素以及该元素对应的集合分类名称,若不存在与所述分词标签相同的元素,则判断是否为时间属性或地名属性的标签,若是时间属性或者地名属性,则存储该标签,否则不存储;将所有分词标签查找后存储的所有元素记为匹配标签G[g1,g2,...,gu],u为最后一个分词标签存储后的元素的数量。优选的,所述第二匹配模块包括模糊匹配单元,所述模糊匹配单元用于将所述匹配标签中的每个元素与所述多叉树中的节点信息进行模糊匹配,若存在两个及以上的匹配标签与节点信息匹配成功,则所述用户为被推送用户。有益效果:本专利技术与现有技术相比,其显著优点是:1、本专利技术通过分析使用用户的属性特征和行为习惯,利用多叉树形成了用户画像,提高针对个人的文化活动内容推荐的精准度;2、通过新发布活动的分词标签与分类分词模型进行精准匹配,将发布活动的信息映射到大数据库形成的分类分词模型中,使得新发布数据信息更加准确的匹配到用户画像中,从而提高活动被推送的用户的精准度,进而提高了推送效率。附图说明图1为本专利技术一实施例所述的方法流程图;图2为本专利技术一实施例所述的用户画像分类示意图;图3为本专利技术其中一实施例所述的装置结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术进行详细描述。实施例1本专利技术提供一种于用户画像的活动推荐方法,如图1所示,该方法包括:S1对文化行业进行分类,形成分类分词模型,并进行存储;依托文化云大数据系统,对接相关文化活动系统和外部数据收集整理,对接的数据系统包括公共文化云平台,图书馆文化云平台,文公共文化数字化服务平台等省市级文化活动平台,外部数据包括THUOCL:清华大学开放中文词库、搜狗分类词库等。设定文化行业分类分词模型,并将相关集合存储到数据库:根据本行业的特性定义了以下6大类,主要包括国家地区,比如中国、江苏省、南京市、江宁区,专业文化团体/艺术家,比如爱乐乐团、潘志涛。文化品牌,比如精彩非遗、五星工程奖、太湖风韵、专有名词,比如十九大、非遗、国庆节。活动类型,比如美术、摄影、书法、曲艺、音乐、舞蹈。艺术形式,比如中国画、油画、版画、民族舞、踢踏舞等。在其中一个实施例中,专业文化团体和艺术家也可分开存储,即定义7大类进行存储。S2对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并进行存储;根据用户的居住地、性别、年龄,预约参加的活动等数据进行统计分析,用户画像体系和标签分类分成四个级别,每个用户拥有包括深度为5的五叉树,所述五叉树的每个节点根据节点信息(父节点ID,节点ID,节点名称)进行存储,并采用深度优先进行遍历查找,如图2所示;在其中一种实施例中,父节点为(0,1,“用户画像”),第一级子节点包括{(1,2,“人口属性”),(1,3,“用户分类”),(1,4,“活动分类”),(1,5,“内容标签”),(1,6,“行为标签”)},同样的,人口属性对应的第二级子节点为{(2,21,“本文档来自技高网...

【技术保护点】
1.一种基于用户画像的活动推荐方法,其特征在于,该方法包括:(1)对文化行业进行分类,形成分类分词模型,并进行存储;(2)对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并进行存储;(3)对新数据信息进行预处理后,得到多个分词标签,并将所述分词标签进行临时存储;(4)将所述分词标签与所述分类分词模型中的元素进行匹配,得到所述分类分词模型中的对应分类;(5)对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,从而确定可参见所述新发布活动的用户群,并对所述新活动进行推送。

【技术特征摘要】
1.一种基于用户画像的活动推荐方法,其特征在于,该方法包括:(1)对文化行业进行分类,形成分类分词模型,并进行存储;(2)对历史用户进行统计分析,形成具有多个级别的用户画像,形成所有用户的标签设定,并进行存储;(3)对新数据信息进行预处理后,得到多个分词标签,并将所述分词标签进行临时存储;(4)将所述分词标签与所述分类分词模型中的元素进行匹配,得到所述分类分词模型中的对应分类;(5)对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,从而确定可参见所述新发布活动的用户群,并对所述新活动进行推送。2.根据权利要求1所述的基于用户画像的活动推荐方法,其特征在于,步骤(1)中,所述分类分词模型包括地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合。3.根据权利要求2所述的基于用户画像的活动推荐方法,其特征在于,所述用户画像为包括深度为n的多叉树,所述多叉树的每个节点根据节点信息(父节点ID,节点ID,节点名称)进行存储,并采用深度优先进行遍历查找。4.根据权利要求3所述的基于用户画像的活动推荐方法,其特征在于,所述步骤(4)中,将所述分词标签与所述分类分词模型中的节点信息进行匹配包括:首先,分别读取每个分词标签,分别查找地区集合、文化团体名称集合、艺术家名字集、文化品牌集合、专有名词集合、活动类别集合以及艺术形式集合中的所有元素,若存在与所述分词标签相同的元素,则存储该元素以及该元素对应的集合分类名称,若不存在与所述分词标签相同的元素,则判断是否为时间属性或地名属性的标签,若是时间属性或者地名属性,则存储该标签,否则不存储;其次,将所有分词标签查找后存储的所有元素记为匹配标签G[g1,g2,...,gu],u为最后一个分词标签存储后的元素的数量。5.根据权利要求4所述的基于用户画像的活动推荐方法,其特征在于,所述步骤(5)中,对得到的所述分类模型中的对应分类与所述用户画像中的标签进行匹配,包括将所述匹配标签中的每个元素与所述多叉树中的节点信息进行模糊匹配,若存在两个及以上的匹配标签与节点信息匹配成功,则所述用户为被推送用户。6.一种根据权利要求1-5任一项所述的基于用户画像的活动推荐方法实现的装置,其特征在于,所述装置包括用户智能终端设备和服务器,所述...

【专利技术属性】
技术研发人员:王振任跃周树佳
申请(专利权)人:南京传唱软件科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1