基于画像的医学科普文章推荐方法及系统技术方案

技术编号：23983933 阅读：21 留言：0更新日期：2020-04-29 12:37

本发明专利技术公开了一种基于画像的医学科普文章推荐方法及系统，该方法包括以下步骤：通过日志打点记录客户端或者服务端的行为日志，所述行为日志的记录内容包括医学科普文章相关日志、用户搜索日志、用户提问日志及登录日志；日志队列对所述行为日志进行数据统计，提取特征数据，处理生成用户画像和文章画像；接收对医学科普文章的请求，根据所述的用户画像和所述的文章画像通过机器学习算法生成相应的推荐文件列表。本发明专利技术的实施例至少有如下有益效果：通过对于用户操作行为的分析，对后续的文章推送内容进行持续性优化，提高推送的速度与质量，提升文章的点击率，满足用户对信息的需求。

The method and system of medical popular science article recommendation based on portrait

全部详细技术资料下载

【技术实现步骤摘要】
基于画像的医学科普文章推荐方法及系统
本专利技术涉及互联网文章推荐
，特别涉及一种基于画像的医学科普文章推荐方法及系统。
技术介绍
互联网的出现和普及给用户带来了大量的信息，满足了用户在信息时代对于信息的需求，但随着快速发展的网络，信息量也随着大幅增长，使得用户面对海量信息时无法从中获取对自己真正有用的信息。在医学科普文章领域，存在着用户体量巨大，偏好差异大，现有的推荐系统多采用协同过滤算法，很难查找到偏好相似的用户，也就难以进而获取相关医学科普文件的推荐列表。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此，本专利技术提出一种基于画像的医学科普文章推荐方法，能够较为准确地找到用户偏好的医学科普文件。根据本专利技术的第一方面实施例的基于画像的医学科普文章推荐方法，包括以下步骤：S100，通过打点日志记录客户端或者服务端的行为日志，所述行为日志的记录内容包括医学科普文章相关日志、用户搜索日志、用户提问日志及登录日志；S200，通过日志队列对所述用户行为日志进行数据统计，提取特征数据，处理生成用户画像和文章画像；S300，接收对医学科普文章的请求，根据所述的用户画像和所述的文章画像通过机器学习算法生成相应的推荐文件列表。根据本专利技术实施例的基于画像的医学科普文章推荐方法，至少具有如下有益效果：通过对于用户操作行为的分析，对后续的文章推送内容进行优化，可以提升文章的点击率，满足用户对信息的需求，提高用户粘着度；两方面画像特征数据的建立，可以建立用户...

【技术保护点】
1.一种基于画像的医学科普文章推荐方法，其特征在于，包括以下步骤：/nS100，通过打点日志记录客户端或者服务端的行为日志，所述行为日志的记录内容包括医学科普文章相关日志、用户搜索日志、用户提问日志及登录日志；/nS200，通过日志队列对所述行为日志进行数据统计，提取特征数据，处理生成用户画像和文章画像；/nS300，接收对医学科普文章的请求，根据所述的用户画像和所述的文章画像通过机器学习算法生成相应的推荐文件列表。/n

【技术特征摘要】
1.一种基于画像的医学科普文章推荐方法，其特征在于，包括以下步骤：
S100，通过打点日志记录客户端或者服务端的行为日志，所述行为日志的记录内容包括医学科普文章相关日志、用户搜索日志、用户提问日志及登录日志；
S200，通过日志队列对所述行为日志进行数据统计，提取特征数据，处理生成用户画像和文章画像；
S300，接收对医学科普文章的请求，根据所述的用户画像和所述的文章画像通过机器学习算法生成相应的推荐文件列表。

2.根据权利要求1所述的基于画像的医学科普文章推荐方法，其特征在于，所述步骤S200包括：
S210，提取所述行为日志中编辑人员新增修改的文章，通过自然语言处理，分词、关键词抽取、主体分析及实体词抽取处理，生成或更新所述文章画像；
S220，提取所述行为日志中用户的行为轨迹，包括文章的阅读、文章的收藏、文章的评论、文章的点赞、搜索记录、咨询购买记录及用户登录记录信息，结合用户的注册信息，统计分析用户偏好的所述文章画像，生成或更新所述用户画像。

3.根据权利要求1所述的基于画像的医学科普文章推荐方法，其特征在于，所述步骤S300包括：
S310，接收用户对医学科普文章的请求，通过若干个召回策略进行召回，获得相应的粗选文章集合；
S320,从所述粗选的文章集合中，按照预设的比例提取排行前列的若干篇文章，合并去重，并根据需要按一定规则进行补充，获得待选文章集；
S330，通过多个特征维度的模型算法，对所述待选文章集的文件预测点击率，根据所述点击率的预测值进行排序推送。

4.根据权利要求3所述的基于画像的医学科普文章推荐方法，其特征在于，所述召回策略包括：Tag召回、Word2Vec召回、热门召回及FP-group召回；所述特征维度的模型算法包括：LR模型算法、XGBoost+LR模型算法、FM模型算法及Wide&Deep模型算法。

5.根据权利要求3所述的基于画像的医学科普文章推荐方法，其特征在于，所述合并去重，包括：从合并后的所述医学科普文章中，去除重复的所述医学科普文章及用户最近看过的所述医学科普文章。

6.根据权...

【专利技术属性】
技术研发人员：李冬，周杰，
申请(专利权)人：珠海健康云科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人