一种基于兴趣度分析的用户数据管理方法技术

技术编号:36421102 阅读:11 留言:0更新日期:2023-01-20 22:28
本发明专利技术公开一种基于兴趣度分析的用户数据管理方法,本发明专利技术通过分析得出目标用户对应的各文本资讯类别偏好符合系数和各视频资讯类别偏好符合系数,进而综合分析得到目标用户对应的各资讯类别偏好符合系数,进行偏好占比推荐,一方面,有效地解决了当前技术对用户数据管理还存在不足的问题,利于保障分析用户偏好数据的准确性,提高了用户数据分析维度,同时还保障了推荐结果的参考性和精准性,一方面,提高了用户推荐结果的效率,贴近了用户的需求,提高了用户的青睐度和信任度,从而增强了用户的推荐精准体验感,另一方面,加强了对视频推荐结果的保障性,同时还降低了系统的推荐任务的难度,降低了系统的工作任务量。降低了系统的工作任务量。降低了系统的工作任务量。

【技术实现步骤摘要】
一种基于兴趣度分析的用户数据管理方法


[0001]本专利技术涉及用户数据管理分析
,涉及到一种基于兴趣度分析的用户数据管理方法。

技术介绍

[0002]随着大数据时代的到来,在互联网上阅读资讯已经成为人们获取资讯的一种常见方式,但是随着资讯数据呈井喷式增长,用户个人在繁杂海量的资讯信息中寻找偏好的资讯数据显得尤为困难,因此,对用户资讯数据进行偏好管理具有着重要意义。
[0003]目前对于用户资讯兴趣度推荐管理大多是通过对用户浏览网页文本内容进行分析,缺少对视频内容进行辅助分析,很显然,当前对用户资讯兴趣度推荐管理还存在以下不足:
[0004]1、当前只对用户浏览的历史文本或视频进行分析,没有对后续的推荐分析进行管理,不利于分析用户偏好数据的准确性,没有对用户浏览文本或视频内容进行深度挖掘,分析维度比较浅显,无法保障推荐结果的参考性和精准性;
[0005]2、当前对用户偏好推荐方式是单单只针对文本内容或视频内容进行分析,没有对文本内容和视频内容进行综合分析,不利于用户资讯兴趣度推荐数据的完整性,无法贴近用户的需求,无法提升系统的推荐力度,影响推荐结果的准确性,降低了用户的青睐度和信任度,从而降低了用户的推荐精准体验感。

技术实现思路

[0006]针对现有技术中的上述缺陷,本专利技术提供一种基于兴趣度分析的用户数据管理方法,具体技术方案如下:
[0007]一种基于兴趣度分析的用户数据管理方法,包括如下步骤:
[0008]步骤一、用户浏览数据获取:获取目标用户历史资讯浏览数据,由此获取目标用户对应的历史浏览资讯条数和各历史浏览资讯对应的浏览形式,并根据各历史浏览资讯对应的浏览形式,将各历史浏览资讯划分为各文本浏览资讯和各视频浏览资讯,同时获取各文本浏览资讯和各视频浏览资讯对应的浏览信息;
[0009]步骤二、文本资讯初步处理:从目标用户各文本浏览资讯对应的浏览信息中定位出资讯标题,通过关键词提取技术对各文本浏览资讯标题进行关键词提取,由此构建各文本浏览资讯标题的各关键词集合,并确认目标用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目和各资讯类别中各文本浏览资讯对应的文本综合浏览信息;
[0010]步骤三、文本资讯兴趣分析:根据目标用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目和各资讯类别中各文本浏览资讯对应的综合浏览信息,综合分析得出目标用户对应的各资讯类别文本初步浏览偏好评估系数;
[0011]步骤四、视频资讯初步处理:从目标用户各视频浏览资讯对应的浏览信息中定位出资讯标题,按照文本资讯初步处理步骤的处理方式同理处理得到目标用户浏览的资讯类
别、各资讯类别对应的视频浏览资讯数目、各资讯类别中文本浏览资讯对应的视频综合浏览信息;
[0012]步骤五、视频资讯兴趣分析:根据目标用户浏览的资讯类别、各资讯类别对应的视频浏览资讯数目、各资讯类别中文本浏览资讯对应的综合浏览信息,综合分析得出目标用户对应的各资讯视频资讯类别偏好符合系数;
[0013]步骤六、视频兴趣度分析:基于目标用户对应的各资讯类别文本初步浏览偏好评估系数和各资讯视频资讯类别偏好符合系数,分析得到目标用户对应的各资讯类别偏好符合系数;
[0014]步骤七、用户兴趣度推荐展示:分析得到目标用户对应的各资讯类别偏好符合系数,进而按照偏好占比推荐。
[0015]在一种可能实施的方式中,所述步骤一中各文本浏览资讯对应的浏览信息包括资讯标题、资讯内容、资讯文本字数、资讯浏览时间信息、浏览时长、观看次数和各次浏览对应的浏览位置;各视频浏览资讯对应的浏览信息包括资讯标题、观看时间信息、观看速度、观看次数、累计观看时长、最长持续观看时长、视频总体播放时长和各次观看对应的观看时长,其中,观看时间信息包括日期和时间点。
[0016]在一种可能实施的方式中,所述步骤二中并确认用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目、各资讯类别中各文本浏览资讯对应的综合浏览信息,具体确认过程包括以下步骤:
[0017]A1、将各文本浏览资讯标题的关键词集合记为E
i
,i表示为各文本资讯对应的编号,i=1,2,......m;
[0018]A2、将各文本资讯的关键词集合与预设的各资讯类别对应的关键词集合进行匹配对比,利用计算公式计算得出各文本资讯的关键词集合与各类型资讯对应的关键词集合的匹配度其中,j表示为各资讯类别对应的编号,j=1,2,......n;
[0019]A3、将各文本资讯的关键词集合与各资讯类别对应的关键词集合的匹配度进行相互比对,将与各文本资讯的关键词集合匹配度最高的资讯类型作为各文本资讯对应的资讯类别,由此得到各文本资讯对应的资讯类别;
[0020]A4、将各文本资讯对应的资讯类别匹配度进行相互对比,统计得到匹配度最高的各文本资讯对应的资讯类别数目,并提取各文本资讯对应的编号,从而确认用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目、各资讯类别中各文本浏览资讯对应的综合浏览信息。
[0021]在一种可能实施的方式中,所述步骤三中综合分析得出目标用户对应的各资讯类别文本初步浏览偏好评估系数,具体分析过程如下:
[0022]B1、根据各资讯类别对应的文本浏览资讯数目、各资讯类别中文本浏览资讯对应的文本综合浏览信息,其中,文本综合浏览信息包括各资讯类别对应综合浏览次数和综合
浏览时长,利用计算公式计算得出目标用户对应的各资讯类别文本初步浏览偏好评估系数β
j
,其中,分别表示为目标用户对应的第i个文本资讯第j个资讯类别对应的文本浏览资讯数目、浏览时长、浏览次数,W

i
、E

i
、R

i
分别表示为目标用户第i个文本资讯对应的资讯文本综合浏览数目、综合浏览时长和综合浏览次数,a1、a2和a3分别表示为设定的资讯浏览数目、浏览时长和浏览次数对应的权重因子,且a1+a2+a3=1;
[0023]B2、根据各资讯类别中各文本资讯对应的编号,提取各文本资讯各次浏览对应的浏览位置,进而提取各文本资讯歌词浏览对应的浏览字数,将各文本资讯歌词浏览对应的浏览字数记为已浏览字数,利用计算公式计算得出目标用户对应的各类别文本浏览完整度χ
j
,其中,Y

j
i表示为第i个文本资讯第j个资讯类别对应的文本总字数,表示为第i个文本资讯第j个资讯类别第u次浏览对应的浏览字数,u表示为各浏览次数对应的编号,u=1,2,......v,进而通过均值计算得到目标用户对应的各类别文本平均浏览完整度,并将其记为
[0024]B3、将各资讯类别中各文本资讯对应的编号,提取各文本资讯对应的资讯浏览时间信息,进而获取浏览日期,得到各浏览日期内各资讯类别对应的文本浏览资讯数目,进而利用计算公式计算得出目标用户对应的各类别文本浏览占比系数δ
j
,其中,表示为第i个文本资本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于兴趣度分析的用户数据管理方法,其特征在于:包括以下步骤:步骤一、用户浏览数据获取:获取目标用户历史资讯浏览数据,由此获取目标用户对应的历史浏览资讯条数和各历史浏览资讯对应的浏览形式,并根据各历史浏览资讯对应的浏览形式,将各历史浏览资讯划分为各文本浏览资讯和各视频浏览资讯,同时获取各文本浏览资讯和各视频浏览资讯对应的浏览信息;步骤二、文本资讯初步处理:从目标用户各文本浏览资讯对应的浏览信息中定位出资讯标题,通过关键词提取技术对各文本浏览资讯标题进行关键词提取,由此构建各文本浏览资讯标题的各关键词集合,并确认目标用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目和各资讯类别中各文本浏览资讯对应的文本综合浏览信息;步骤三、文本资讯兴趣分析:根据目标用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目和各资讯类别中各文本浏览资讯对应的综合浏览信息,综合分析得出目标用户对应的各资讯类别文本初步浏览偏好评估系数;步骤四、视频资讯初步处理:从目标用户各视频浏览资讯对应的浏览信息中定位出资讯标题,按照文本资讯初步处理步骤的处理方式同理处理得到目标用户浏览的资讯类别、各资讯类别对应的视频浏览资讯数目、各资讯类别中文本浏览资讯对应的视频综合浏览信息;步骤五、视频资讯兴趣分析:根据目标用户浏览的资讯类别、各资讯类别对应的视频浏览资讯数目、各资讯类别中文本浏览资讯对应的综合浏览信息,综合分析得出目标用户对应的各资讯视频资讯类别偏好符合系数;步骤六、视频兴趣度分析:基于目标用户对应的各资讯类别文本初步浏览偏好评估系数和各资讯视频资讯类别偏好符合系数,分析得到目标用户对应的各资讯类别偏好符合系数;步骤七、用户兴趣度推荐展示:分析得到目标用户对应的各资讯类别偏好符合系数,进而按照偏好占比推荐。2.根据权利要求1所述的一种基于兴趣度分析的用户数据管理方法,其特征在于:所述步骤一中各文本浏览资讯对应的浏览信息包括资讯标题、资讯内容、资讯文本字数、资讯浏览时间信息、浏览时长、观看次数和各次浏览对应的浏览位置;各视频浏览资讯对应的浏览信息包括资讯标题、观看时间信息、观看速度、观看次数、累计观看时长、最长持续观看时长、视频总体播放时长和各次观看对应的观看时长,其中,观看时间信息包括日期和时间点。3.根据权利要求2所述的一种基于兴趣度分析的用户数据管理方法,其特征在于:所述步骤二中并确认用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目、各资讯类别中各文本浏览资讯对应的综合浏览信息,具体确认过程包括以下步骤:A1、将各文本浏览资讯标题的关键词集合记为E
i
,i表示为各文本资讯对应的编号,i=1,2,......m;A2、将各文本资讯的关键词集合与预设的各资讯类别对应的关键词集合进行匹配对比,利用计算公式计算得出各文本资讯的关键词集合与各类型资讯对应的
关键词集合的匹配度其中,j表示为各资讯类别对应的编号,j=1,2,......n;A3、将各文本资讯的关键词集合与各资讯类别对应的关键词集合的匹配度进行相互比对,将与各文本资讯的关键词集合匹配度最高的资讯类型作为各文本资讯对应的资讯类别,由此得到各文本资讯对应的资讯类别;A4、将各文本资讯对应的资讯类别匹配度进行相互对比,统计得到匹配度最高的各文本资讯对应的资讯类别数目,并提取各文本资讯对应的编号,从而确认用户浏览的资讯类别、各资讯类别对应的文本浏览资讯数目、各资讯类别中各文本浏览资讯对应的综合浏览信息。4.根据权利要求3所述的一种基于兴趣度分析的用户数据管理方法,其特征在于:所述步骤三中综合分析得出目标用户对应的各资讯类别文本初步浏览偏好评估系数,具体分析过程如下:B1、根据各资讯类别对应的文本浏览资讯数目、各资讯类别中文本浏览资讯对应的文本综合浏览信息,其中,文本综合浏览信息包括各资讯类别对应综合浏览次数和综合浏览时长,利用计算公式计算得出目标用户对应的各资讯类别文本初步浏览偏好评估系数β
j
,其中,分别表示为目标用户对应的第i个文本资讯第j个资讯类别对应的文本浏览资讯数目、浏览时长、浏览次数,W

i
、E

i
、R

i
分别表示为目标用户第i个文本资讯对应的资讯文本综合浏览数目、综合浏览时长和综合浏览次数,a1、a2和a3分别表示为设定的资讯浏览数目、浏览时长和浏览次数对应的权重因子,且a1+a2+a3=1;B2、根据各资讯类别中各文本资讯对应的编号,提取各文本资讯各次浏览对应的浏览位置,进而提取各文本资讯歌词浏览对应的浏览字数,将各文本资讯歌词浏览对应的浏览字数记为已浏览字数,利用计算公式计算得出目标用户对应的各类别文本浏览完整度χ
j
,其中,Y

j
i表示为第i个文本资讯第j个资讯类别对应的文本总字数,表示为第i个文本资讯第j个资讯类别第u次浏览对应的浏览字数,u表示为各浏览次数对应的编号,u=1,2,......v,进而通过均值计算得到目标用户对应的各类别文本平均浏览完整度,并将其记为B3、将各资讯类别中各文本资讯对应的编号,提取各文本资讯对应的资讯浏览时间信息,进而获取浏览日期,得到各浏览日期内各资讯类别对应的文本浏览资...

【专利技术属性】
技术研发人员:熊飘
申请(专利权)人:武汉谆教教育咨询中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1