一种基于广义点集距离的信息个性化推荐及提示方法技术

技术编号:19778386 阅读:23 留言:0更新日期:2018-12-15 11:20
本发明专利技术涉及一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;步骤C,计算距离值d并推送相关信息;若距离值d=0,直接向其推送相关信息;若距离值d不为0,如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定两种提示法,则推送阈值提示法和数量提示法推送结果的合集。本发明专利技术兼容更多数据类型,提高推送的精准度和用户的区分度。

【技术实现步骤摘要】
一种基于广义点集距离的信息个性化推荐及提示方法
本专利技术涉及个性化推荐系统
,具体涉及一种基于广义点集距离的信息个性化推荐及提示方法。
技术介绍
个性化推荐系统旨在依据一定的算法向用户提供个性化的信息服务和决策支持,目前广泛应用在新闻推荐、商务推荐、娱乐推荐、学习推荐、生活推荐、决策支持等多个领域。得益于广泛的应用,个性化推荐已成为学术界与工业界的研究热点。已有的信息个性化推荐技术包括基于协同过滤的推荐系统、基于点集距离的推荐系统等,后者是最接近本专利技术的现有技术。基于协同过滤的推荐系统利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,但对于新信息、新用户推荐效果较差,即存在“冷启动”问题。基于点集距离的推荐系统,适合对具有标签的信息进行个性化推荐,即直接向符合该标签的用户推荐信息,本质就是当点集距离为0时,推荐该信息,这里的点就是用户属性,集就是符合拟推荐信息适用的用户属性集合(范围)。该方法仅用面向数值属性的普通点集距离,未包括其它距离方法,如海明距离等;并且该方法未对“差点就符合推荐要求”的用户进行推荐及提示其欠缺条件。
技术实现思路
本专利技术的目的在于针对现有技术中的不足之处,提供一种兼容更多数据类型,对接近个性化推荐要求的用户,给出其欠缺条件提示的基于广义点集距离的信息个性化推荐及提示方法。为达此目的,本专利技术采用以下技术方案:一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:其中c(xi,yi)为用户对非数值属性自行定义的距离函数;步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。更进一步的说明,对距离值d小于阈值t的所有对象推送欠缺条件提示信息时,使用逐个计算距离并推送或对所有对象计算距离之后,一次性对距离值d小于阈值t的所有对象批量推送的方法;对距离值d最小的p个对象推送欠缺条件提示信息时,逐个计算距离并保留距离值最小的p个对象,再一次性批量推送。更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,根据距离值建立大根堆结构,维护最小的p个对象在所述大根堆上。更进一步的说明,所述距离函数适用数值属性时还可以采用的包括欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数;假设数据x、y分别有N个数值属性,则欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数的计算方法分别如下:欧氏距离:曼哈顿距离:标准化欧氏距离:其中是第i维度的方差。更进一步的说明,所述距离函数适用非数值属性时,若用户属性为字符串的表现形式,则使用海明距离或编辑距离的计算方式,或用户自定义的计算方式;海明距离的计算公式为:其中a、b为字符串;编辑距离的计算公式为:其中a、b为字符串。更进一步的说明,步骤A中,若用户选择提示方法但没设置欠缺条件提示距离阈值t或欠缺条件提示数量p,则使用预设的缺省值。更进一步的说明,步骤C中,推送的阈值提示法和数量提示法推送结果的合集为阈值提示法和数量提示法推送结果的并集,且对重复的单个推送对象不再重复推送。更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,还可以使用插入排序,或者在所有对象计算完之后,使用快速排序或归并排序的方式。更进一步的说明,用户可对所述距离函数d(x,y)进行修正改进,对数值属性和非数值属性设定权重加成;权重加成的计算公式为:其中w1、w2、w3分别为对象x、y的第1、2、3个属性的权重。更进一步的说明,当用户属性为非数值属性时,若实际的用户属性在设定的用户属性集合中,则距离值为0;若实际的用户属性不在设定的用户属性集合中,则距离值由用户自定义的距离函数c(xi,yi)计算得出。本专利技术的有益效果:(1)将普通的点集距离发展为广义点集距离,以兼容更多数据类型。(2)兼顾信息精准推荐与欠缺条件提示信息推送,对接近个性化推荐要求的用户进行排序,给出其欠缺条件提示,提高推送的精准度和用户的区分度。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是本专利技术的一个实施例的流程图。具体实施方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。如图1所示,一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:其中c(xi,yi)为用户对非数值属性自行定义的距离函数;步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。将用户属性分为数值类和非数值类两大类,从而将普通的点集距离发展为广义点集距离,可以兼容更多数据类型。对于数值属性的用户属性进行系统预设距离函数的计算或通过用户自行设定的距离函数进行运算,对于非数值属性的用户属性进行自行设定的距离函数的运算。通过对运算结果的分析,用户从阈值提示法和数量提示法至少选择一个方式对完全符合以及接近个性化推荐要求的用户给出其欠缺条件提示。例如信息推荐的要求是年龄30-50岁(这是一个集合,包括30、31、32……50一共21个整数),而拟推荐对象的年龄是28岁,那么可以使用28与30的差的绝对值与信息推荐要求年龄跨度的商为距离函数,这个距离的值d为0.1(即|28本文档来自技高网...

【技术保护点】
1.一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:

【技术特征摘要】
1.一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:其中c(xi,yi)为用户对非数值属性自行定义的距离函数;步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。2.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:对距离值d小于阈值t的所有对象推送欠缺条件提示信息时,使用逐个计算距离并推送或对所有对象计算距离之后,一次性对距离值d小于阈值t的所有对象批量推送的方法;对距离值d最小的p个对象推送欠缺条件提示信息时,逐个计算距离并保留距离值最小的p个对象,再一次性批量推送。3.根据权利要求2所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:进行逐个计算距离并保留最小的p个对象这一操作时,根据距离值建立大根堆结构,维护最小的p个对象在所述大根堆上。4.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:所述距离函数适用数值属性时还可以采用的包括欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数;...

【专利技术属性】
技术研发人员:黄文俊
申请(专利权)人:广东奥博信息产业股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1