医疗健康数据处理系统技术方案

技术编号:34759002 阅读:14 留言:0更新日期:2022-08-31 18:57
本发明专利技术公开了一种医疗健康数据处理系统。该系统包括:行为埋点子系统、标签子系统及搜索推荐子系统;其中,行为埋点子系统,用于采集用户行为日志数据,并将该用户行为日志数据流式结构化处理之后进行存储;标签子系统,用于根据领域定制标签库和来自于行为埋点子系统的用户行为日志数据获取用户画像的用户注意力标签,对该用户行为日志数据进行处理形成描述用户画像的基本属性和动态属性,并结合媒体内容基础数据和领域定制标签库获取内容模型;搜索推荐子系统,通过用户画像的数据和内容模型的计算处理来实现内容的分发。本系统更好地应对了医疗健康数据的处理和应用,更好地解决用户与内容的匹配,对于内容而言实现了千人千面的精准分发。面的精准分发。面的精准分发。

【技术实现步骤摘要】
医疗健康数据处理系统


[0001]本专利技术涉及通信领域,具体而言,涉及一种医疗健康数据处理系统。

技术介绍

[0002]互联网技术的发展带给人们生活极大的改变,从传统的App到微信小程序,快应用,5G消息Chatbot,随着互联网业务规模和数据量的增长,使用原有方法构建的系统架构已经无法满足产品线多样性的需求,近些年来在原有前台和后台的基础上,又提出了中台的概念,本质上是为了解决在同一企业中产品多样性带来的架构与业务发展问题。
[0003]数据中台是一种基于数据驱动的构建理念,旨在通过业务发展而产生的数据能力,通过数据积累加上最近发展起来的大数据,人工智能技术来提高企业团队的产品力和业务分析能力。
[0004]医疗健康垂直领域的互联网产品,现有数据包括:用户行为日志数据以及大量的知识内容数据,对于提供线上医疗服务的产品还集成了很多医院/医生等数据,互联网医疗产品解决的问题依然是用户与医疗信息服务/医疗服务分发的问题,那么分发效率就必然成为业务发展的一个必须要妥善解决的问题。
[0005]相关技术中,医疗健康内容分发模式基于互联网传统的节目单模式,各种实体数据基于所有访问者都相同的编辑驱动列表方式,这种分发用户的点击率/转化率不高,效率低下,用户很难直接获取到对自己真正有价值的信息,即使通过传统搜索也无法做到千人千面。
[0006]随着近几年来,大数据与人工智能技术的发展,对于海量的数据处理更加具有可操作性,而且数据的价值重新被评估与提出,而提供医疗健康信息服务与医疗服务的互联网行业积累了大量的内容数据,服务数据以及用户数据,如何用好这些数据更好的提升业务能力与产品力成为了一个新的解决思路。医疗健康领域有其特殊性,在一些产品应用时通过更加精细化的数据分析与计算,更好地连接用户与内容是数据驱动的一种新方式。
[0007]因此,在医疗健康领域中,如何搭建一套数据中台系统架构,以更好地应对医疗健康数据的处理和应用,更好地解决用户与内容的匹配,提高内容分发效率,是目前亟待解决的问题。

技术实现思路

[0008]本专利技术的主要目的在于公开了一种医疗健康数据处理系统,以至少解决相关技术中医疗健康内容和服务分发模式基于互联网传统的节目单模式,这种分发方式,用户点击率和转化率不高,效率低下,用户很难直接获取到对自己真正有价值的信息,即使通过传统搜索也无法做到千人千面的问题。
[0009]根据本专利技术,提供了一种医疗健康数据处理系统。
[0010]根据本专利技术的医疗健康数据处理系统包括:行为埋点子系统、标签子系统以及搜索推荐子系统;其中,所述行为埋点子系统,用于采集用户行为日志数据,并将该用户行为
日志数据流式结构化处理之后进行存储;所述标签子系统,与所述行为埋点子系统相连接,用于根据领域定制标签库和来自于所述行为埋点子系统的用户行为日志数据获取用户画像的用户注意力标签,对该用户行为日志数据进行处理形成描述所述用户画像的基本属性和动态属性,并结合媒体内容基础数据和所述领域定制标签库获取内容模型;搜索推荐子系统,分别与所述行为埋点子系统和所述标签子系统相连接,通过所述用户画像的数据和所述内容模型的计算处理来实现内容的分发。
[0011]本专利技术提供了一种医疗健康数据处理系统,该系统中,行为埋点子系统采集大量的用户行为日志数据,标签子系统通过对用户行为日志数据的分析与处理实现用户的画像特征化与数字化,对内容数据进行标签化形成针对内容的模型,推荐搜索子系统通过所述用户画像的数据和所述内容模型的匹配处理,更好地应对了医疗健康数据的处理和应用,更好地解决用户与内容的匹配,对于内容而言实现了千人千面的精准分发。
附图说明
[0012]图1是根据本专利技术实施例的医疗健康数据处理系统的结构框图;
[0013]图2是根据本专利技术优选实施例的医疗健康数据处理系统的结构框图;
[0014]图3是根据本专利技术优选实施例的医疗健康数据处理系统的结构示意图;
[0015]图4是根据本专利技术优选实施例的医疗健康数据处理系统的数据处理关系示意图。
具体实施方式
[0016]下面结合说明书附图对本专利技术的具体实现方式做一详细描述。
[0017]图1是根据本专利技术实施例的医疗健康数据处理系统的结构框图。如图1所示,该医疗健康数据处理系统包括:行为埋点子系统10、标签子系统12以及搜索推荐子系统14;其中,上述行为埋点子系统10,用于采集用户行为日志数据,并将该用户行为日志数据流式结构化处理之后进行存储;上述标签子系统12,与上述行为埋点子系统10相连接,用于根据领域定制标签库和来自于上述行为埋点子系统的用户行为日志数据获取用户画像的用户注意力标签,对该用户行为日志数据进行处理形成描述上述用户画像的基本属性和动态属性,并结合媒体内容基础数据和上述领域定制标签库获取内容模型;搜索推荐子系统14,分别与上述行为埋点子系统10和上述标签子系统12相连接,通过上述用户画像的数据和上述内容模型的匹配处理来实现内容的分发。
[0018]通过图1所示的系统,行为埋点子系统采集大量的用户行为日志数据,标签子系统通过对用户行为日志数据的分析与处理实现用户的画像特征化与数字化,对内容数据进行标签化形成针对内容的模型,推荐搜索子系统通过上述用户画像的数据和上述内容模型的匹配处理,更好地应对了医疗健康数据的处理和应用,更好地解决用户与内容的匹配,对于内容而言实现了千人千面的精准分发。
[0019]其中,上述用户行为日志数据主要描述某个用户在某个时间做了某件事,行为埋点子系统中,可以通过终端应用上的JS埋点框架搜集用户在终端上的行为日志数据,此外,也可以通过适配服务器进行埋点搜集和上报用户行为日志数据。行为埋点子系统将该用户行为日志数据流式结构化处理之后,由相应的处理软件进行初步的数据清洗过滤,并且以日志的形式实时导入消息队列进行存储,形成用户行为日志数据。因此,行为埋点子系统从
架构上可以设置在客户端上,也可以设置在服务端上,或者同时设置于客户端和服务端上。
[0020]优选地,如图2所示,该行为埋点子系统10可以进一步包括:收集模块100,设置于终端设备和/或适配服务器中,用于收集用户行为日志数据;Nginx网关服务模块102,用于在用户访问时记录上述用户行为日志数据;Flume服务模块104,用于对记录的上述用户行为日志数据进行数据流式结构化处理;Kafka服务模块106,用于将上述Flume服务模块处理后的上述用户行为日志数据导入消息队列并进行存储。
[0021]在优选实施过程中,如图3所示,用户通过手机客户端,H5或者5G消息适配服务访问,设置于终端设备和/或适配服务器中的收集模块,收集用户行为日志数据;用户访问时Nginx网关服务模块会记录访问日志,Flume服务模块通过对Nginx用户访问日志进行数据流式结构化处理后发送给Kafka服务模块的Kafka消息存储队列集群服务进行持久化保存,这些数据可以为后续的数据分析工作提供数据源。
[0022本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗健康数据处理系统,其特征在于,包括:行为埋点子系统、标签子系统以及搜索推荐子系统;其中,所述行为埋点子系统,用于采集用户行为日志数据,并将该用户行为日志数据流式结构化处理之后进行存储;所述标签子系统,与所述行为埋点子系统相连接,用于根据领域定制标签库和来自于所述行为埋点子系统的用户行为日志数据获取用户画像的用户注意力标签,对该用户行为日志数据进行处理形成描述所述用户画像的基本属性和动态属性,并结合媒体内容基础数据和所述领域定制标签库获取内容模型;搜索推荐子系统,分别与所述行为埋点子系统和所述标签子系统相连接,通过所述用户画像的数据和所述内容模型的匹配处理来实现内容的分发。2.根据权利要求1所述的系统,其特征在于,所述行为埋点子系统包括:收集模块,设置于终端设备和/或适配服务器中,用于收集用户行为日志数据;Nginx网关服务模块,用于在用户访问时记录所述用户行为日志数据;Flume服务模块,用于对记录的所述用户行为日志数据进行数据流式结构化处理;Kafka服务模块,用于将所述Flume服务模块处理后的所述用户行为日志数据导入消息队列并进行存储。3.根据权利要求1所述的系统,其特征在于,所述标签子系统包括:Spark服务模块,用于读取所述消息队列中的所述用户行为日志数据,根据领域定制标签库和该用户行为日志数据获取所述用户画像的用户注意力标签,对该用户行为日志数据进行处理形成描述所述用户画像的基本属性和动态属性;索引数据集群模块,用于接收来自于所述Spark服务模块的所述用户注意力标签并保存;所述Hadoop集群模块,用于结合媒体内容基础数据和所述领域定制标签库运算获取所述内容模型并保存;守护服务模块,用于向Hadoop集群模块提交任务,完成任务和控制和管理,并将所述Hadoop集群模块中保存的数据导入所述推荐搜索子系统。4.根据权利要求3所述的系统,其特征在于,所述Spark服务模块,还用于过滤出符合用户点击特征的用户行为日志数据,并将用户点击推荐的信息反馈给所述推荐搜索系统,为训练点击通过率CTR模型提供训练数据,其中,所述CTR模型用于实现点击率排序的预测。5.根据权利要求3所述的系统,其特征在于,所述索引数据集群模块包括:MySQL特征数据库和ElasticSearch索引库,其中,所述MySQL特征数据库与所述ElasticSearch索引库,用于接收来自于所述标签子系统中S...

【专利技术属性】
技术研发人员:国兴旺袁乾烽欧锦华王志广叶永钦王火生袁锐
申请(专利权)人:广州启生信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1