基于阅读时长的关键词加权方法、系统、设备及介质技术方案

技术编号:31768232 阅读:77 留言:0更新日期:2022-01-05 16:53
本发明专利技术公开了一种基于阅读时长的关键词加权方法、系统、计算机设备及存储介质,其方法包括:提取预设文本下的预设标题,并将预设标题作为目标标签;获取用户阅读预设标题下文本内容的阅读时长;根据预设标题所在预设文本中的前后位置,对阅读时长进行修正,得到修正后的阅读时长;以修正后的阅读时长作为目标标签下文本内容的权重值。本发明专利技术的技术方案根据用户阅读时长对文本中的关键词进行加权,以提升该文本的优先推送程度。该文本的优先推送程度。该文本的优先推送程度。

【技术实现步骤摘要】
基于阅读时长的关键词加权方法、系统、设备及介质


[0001]本专利技术涉及信息处理领域,尤其涉及一种基于阅读时长的关键词加权方法、系统、计算机设备及存储介质。

技术介绍

[0002]在大数据时代,根据用户喜好而推送相应的内容已是目前APP应用的一种常规操作。例如,在通过计算机程序分析一篇旅游攻略时,攻略内容一般包含多种子主题例如当前行程下多目的地的吃、住、行、游等;攻略的关键词可以用于对用户偏好进行分类标签,但不能简单地根据文章文本判断关键词的重要度,进而使得该攻略在同类相似文章中脱颖而出,便于推送给其他需要该攻略的用户。
[0003]因此,提取关键词是非常重要的一步。然而,目前的提取算法还比较粗糙,如专利申请号为CN106777139A所述的技术方案,其解决的技术问题主要是如何定位用户所感兴趣的关键词,而在该阶段之后,仍然缺乏对关键词的进一步筛选,以便准确提炼各文本的重要性程度并置于优选推送的位置。

技术实现思路

[0004]为克服上述技术问题,本专利技术提供一种基于阅读时长的关键词加权方法、系统、计算机设备及存储介质本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于阅读时长的关键词加权方法,其特征在于,包括:提取预设文本下的预设标题,并将所述预设标题作为目标标签;获取用户阅读所述预设标题下文本内容的阅读时长;根据所述预设标题所在所述预设文本中的前后位置,对所述阅读时长进行修正,得到修正后的阅读时长;以所述修正后的阅读时长作为所述目标标签下文本内容的权重值。2.如权利要求1所述的基于阅读时长的关键词加权方法,其特征在于,所述获取用户阅读所述预设标题下文本内容的阅读时长,包括:获取多个用户阅读所述预设标题下文本内容的阅读时长;在所述对所述阅读时长进行修正之后,并在以修正后的阅读时长作为所述目标标签下文本内容的权重值之前,所述基于阅读时长的关键词加权方法,还包括:根据用户数量,将修正后的阅读时长进行归一化处理,得到修正后的阅读时长。3.如权利要求2所述的基于阅读时长的关键词加权方法,其特征在于,在所述将修正后的阅读时长进行归一化处理之后,并且在以修正后的阅读时长作为所述目标标签下文本内容的权重值之前,所述基于阅读时长的关键词加权方法,还包括:对归一化处理后的阅读时长进行方差去噪,得到修正后的阅读时长。4.如权利要求3所述的基于阅读时长的关键词加权方法,其特征在于,所述以所述修正后的阅读时长作为所述目标标签下文本内容的权重值,包括:计算所述修正后的阅读时长的平均值,并以所述平均值作为所述目标标签下文本内容的权重值。5.如权利要求4所述的基于阅读时长的关键词加权方法,其特征在于,在所述以所述平均值作为所述目标标签下文本内容的权重值之后,所述基于阅读时长的关键词加权方法,...

【专利技术属性】
技术研发人员:赵鹏李尚锦
申请(专利权)人:深圳市活力天汇科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1