System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大数据的用户匹配方法组成比例_技高网

基于大数据的用户匹配方法组成比例

技术编号:41210762 阅读:2 留言:0更新日期:2024-05-09 23:33
本申请提供一种基于大数据的用户匹配方法,通过对用户数据集的用户基本数据、用户标签数据,对用户数据集的每条用户信息进行划分,确定出候选用户子集;基于标记用户的用户行为数据,对标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户。利用矩阵映射的方式,对每条用户信息中结构化或半结构化的数据进行特征提取,得到相应的特征矩阵,对特征矩阵进行简单的处理,能够得到反映用户近似相似的数组,通过排序即可实现近似的归类效果,由此将用户数据集划分为多个候选子集。利用每个标记用户所在的候选子集,在候选子集内进行匹配度计算,不仅能够有效保证匹配精度,还能显著降低数据处理量,大大提升匹配效率。

【技术实现步骤摘要】

本申请涉及大数据,具体而言,涉及一种基于大数据的用户匹配方法


技术介绍

1、随着平台用户量的激增,用户的匹配推荐需要处理的数据量显著增加,导致用户的匹配时长逐渐增加,服务器的数据处理压力也显著提升。现有的用户匹配机制,通常需要计算用户之间的相似度或距离。而传统的完全计算方法需要对大规模数据进行全局计算,造成巨大的计算开销。而一些随机型的匹配方案,则导致匹配精度降低,难以满足需求。


技术实现思路

1、本申请实施例的目的在于提供一种基于大数据的用户匹配方法,以在保证匹配精度的条件下,提升用户的匹配效率,降低数据计算压力。

2、为了实现上述目的,本申请的实施例通过如下方式实现:

3、第一方面,本申请实施例提供一种基于大数据的用户匹配方法,包括:获取用户数据集,其中,用户数据集包含n条用户信息,每条用户信息包含用户基本数据、用户标签数据和用户行为数据;基于用户基本数据、用户标签数据,对所述用户数据集的每条用户信息进行划分,确定出候选用户子集;针对每个标记用户,基于所述标记用户的用户行为数据,对所述标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户,其中,每个标记用户对应一个会话主题。

4、结合第一方面,在第一方面的第一种可能的实现方式中,基于用户基本数据、用户标签数据,对所述用户数据集的每条用户信息进行划分,确定出候选用户子集,包括:针对每条用户信息,将用户信息对应的用户基本数据、用户标签数据映射到p×q的模板矩阵中,得到对应的矩阵ri,1≤i≤n;基于矩阵ri中每个列的数值分布,确定出对应的一维数组ai;基于每个一维数组ai的元素数值,对n个一维数组ai进行排序,得到数组序列;将数组序列划分为s个区间,并将每个区间内的一维数组ai对应的用户信息划分到同一个候选用户子集中,得到s个候选用户子集。

5、结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,基于矩阵ri中每个列的数值分布,确定出对应的一维数组ai,包括:针对矩阵ri:确定出每列数据中第一个数值“1”所在的行号;将每列数据中第一个数值“1”所在的行号按照列号的顺序排列,确定出一维数组ai。

6、结合第一方面,在第一方面的第三种可能的实现方式中,用户行为数据包括用户提问信息、用户收藏信息、用户回答信息,基于所述标记用户的用户行为数据,对所述标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户,包括:将所述标记用户的用户提问信息、用户收藏信息、用户回答信息与所述标记用户对应的会话主题进行契合指数计算;基于契合指数,确定出用户需求类型,其中,所述用户需求类型包括i型、ii型和iii型;基于所述标记用户对应的会话主题、所述用户需求类型,对所述标记用户所在候选用户子集中每个用户的用户提问信息、用户收藏信息、用户回答信息进行匹配度计算,确定出对应的目标用户。

7、结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,契合指数包括提问契合指数、收藏契合指数和回答契合指数,将所述标记用户的用户提问信息、用户收藏信息、用户回答信息与所述标记用户对应的会话主题进行契合指数计算,包括:从所述标记用户的用户提问信息、用户收藏信息、用户回答信息中确定出与所述标记用户对应的会话主题同类型的关联用户提问信息、关联用户收藏信息、关联用户回答信息;基于关联用户提问信息,确定出提问契合指数;基于关联用户收藏信息,确定出收藏契合指数;基于关联用户回答信息,确定出回答契合指数。

8、结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,基于契合指数,确定出用户需求类型,包括:若提问契合指数大于收藏契合指数与回答契合指数之和,确定所述用户需求类型为i型;若回答契合指数大于收藏契合指数与提问契合指数之和,确定所述用户需求类型为ii型;否则,确定所述用户需求类型为iii型。

9、结合第一方面的第三种可能的实现方式,在第一方面的第六种可能的实现方式中,基于所述标记用户对应的会话主题、所述用户需求类型,对所述标记用户所在候选用户子集中每个用户的用户提问信息、用户收藏信息、用户回答信息进行匹配度计算,确定出对应的目标用户,包括:若所述用户需求类型为i型,针对所述标记用户所在候选用户子集中每个用户:基于用户收藏信息、用户回答信息,计算用户与所述会话主题的i型匹配度;基于每个用户的i型匹配度,确定出对应的目标用户;若所述用户需求类型为ii型,针对所述标记用户所在候选用户子集中每个用户:基于用户提问信息、用户收藏信息,计算用户与所述会话主题的ii型匹配度;基于每个用户的ii型匹配度,确定出对应的目标用户;若所述用户需求类型为iii型,针对所述标记用户所在候选用户子集中每个用户:基于用户提问信息、用户收藏信息、用户回答信息,计算用户与所述会话主题的iii型匹配度;基于每个用户的iii型匹配度,确定出对应的目标用户。

10、结合第一方面的第六种可能的实现方式,在第一方面的第七种可能的实现方式中,基于用户收藏信息、用户回答信息,计算用户与所述会话主题的i型匹配度,包括:确定出与所述会话主题同类型的关联用户收藏信息和关联用户回答信息;对每个关联用户收藏信息和每个关联用户回答信息计算i型匹配分值;基于每个i型匹配分值计算用户的i型匹配度。

11、结合第一方面的第六种可能的实现方式,在第一方面的第八种可能的实现方式中,基于用户提问信息、用户收藏信息,计算用户与所述会话主题的ii型匹配度,包括:确定出与所述会话主题同类型的关联用户提问信息和关联用户收藏信息;对每个关联用户提问信息和每个关联用户收藏信息计算ii型匹配分值;基于每个ii型匹配分值计算用户的ii型匹配度。

12、结合第一方面的第六种可能的实现方式,在第一方面的第九种可能的实现方式中,基于用户提问信息、用户收藏信息、用户回答信息,计算用户与所述会话主题的iii型匹配度,包括:确定出与所述会话主题同类型的关联用户提问信息、关联用户收藏信息和关联用户回答信息;对每个关联用户提问信息和每个关联用户收藏信息计算ii型匹配分值;基于每个ii型匹配分值计算用户的ii型匹配度。

13、有益效果:

14、1.本申请实施例通过对用户数据集的用户基本数据、用户标签数据,对用户数据集的每条用户信息进行划分,确定出候选用户子集;针对每个标记用户,基于标记用户的用户行为数据,对标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户。利用矩阵映射的方式,对每条用户信息中结构化或半结构化的数据进行特征提取,得到相应的特征矩阵(矩阵ri),对特征矩阵进行简单的处理,能够得到反映用户近似相似的数组(一维数组ai),通过排序即可实现近似的归类效果,由此将用户数据集划分为多个候选子集。利用每个标记用户所在的候选子集,在候选子集内进行匹配度计算,不仅能够有效保证匹配精度,还能显著降低数据处理量,大大提升匹配效率。且本方案能够在多用户匹配和实时匹配的场景本文档来自技高网...

【技术保护点】

1.一种基于大数据的用户匹配方法,其特征在于,包括:

2.根据权利要求1所述的基于大数据的用户匹配方法,其特征在于,基于用户基本数据、用户标签数据,对所述用户数据集的每条用户信息进行划分,确定出候选用户子集,包括:

3.根据权利要求2所述的基于大数据的用户匹配方法,其特征在于,基于矩阵ri中每个列的数值分布,确定出对应的一维数组ai,包括:

4.根据权利要求1所述的基于大数据的用户匹配方法,其特征在于,用户行为数据包括用户提问信息、用户收藏信息、用户回答信息,基于所述标记用户的用户行为数据,对所述标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户,包括:

5.根据权利要求4所述的基于大数据的用户匹配方法,其特征在于,契合指数包括提问契合指数、收藏契合指数和回答契合指数,将所述标记用户的用户提问信息、用户收藏信息、用户回答信息与所述标记用户对应的会话主题进行契合指数计算,包括:

6.根据权利要求5所述的基于大数据的用户匹配方法,其特征在于,基于契合指数,确定出用户需求类型,包括:

7.根据权利要求4所述的基于大数据的用户匹配方法,其特征在于,基于所述标记用户对应的会话主题、所述用户需求类型,对所述标记用户所在候选用户子集中每个用户的用户提问信息、用户收藏信息、用户回答信息进行匹配度计算,确定出对应的目标用户,包括:

8.根据权利要求7所述的基于大数据的用户匹配方法,其特征在于,基于用户收藏信息、用户回答信息,计算用户与所述会话主题的I型匹配度,包括:

9.根据权利要求7所述的基于大数据的用户匹配方法,其特征在于,基于用户提问信息、用户收藏信息,计算用户与所述会话主题的II型匹配度,包括:

10.根据权利要求7所述的基于大数据的用户匹配方法,其特征在于,基于用户提问信息、用户收藏信息、用户回答信息,计算用户与所述会话主题的III型匹配度,包括:

...

【技术特征摘要】

1.一种基于大数据的用户匹配方法,其特征在于,包括:

2.根据权利要求1所述的基于大数据的用户匹配方法,其特征在于,基于用户基本数据、用户标签数据,对所述用户数据集的每条用户信息进行划分,确定出候选用户子集,包括:

3.根据权利要求2所述的基于大数据的用户匹配方法,其特征在于,基于矩阵ri中每个列的数值分布,确定出对应的一维数组ai,包括:

4.根据权利要求1所述的基于大数据的用户匹配方法,其特征在于,用户行为数据包括用户提问信息、用户收藏信息、用户回答信息,基于所述标记用户的用户行为数据,对所述标记用户所在候选用户子集中的用户进行匹配度计算,确定出对应的目标用户,包括:

5.根据权利要求4所述的基于大数据的用户匹配方法,其特征在于,契合指数包括提问契合指数、收藏契合指数和回答契合指数,将所述标记用户的用户提问信息、用户收藏信息、用户回答信息与所述标记用户对应的会话主题进行契合指数计算,...

【专利技术属性】
技术研发人员:叶成景
申请(专利权)人:广东科学技术职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1