基于诊疗数据的用户画像标签挖掘方法、装置及计算机设备制造方法及图纸

技术编号:36378127 阅读:15 留言:0更新日期:2023-01-18 09:38
本发明专利技术实施例公开了基于诊疗数据的用户画像标签挖掘方法、装置及计算机设备。所述方法包括:构建疾病数据库;获取就诊文件的图片;对图片进行文本识别,以得到患者信息;将患者信息按照所述疾病数据库中节点对应的数据进行分类比较,以得到疾病及药物治疗标签;将疾病及药物治疗标签、所述患者信息进行聚类分析,以确定强关联性的患者信息、疾病及药物治疗标签;将强关联性的疾病及药物治疗标签作为用户标签进行存储,以得到新标签;将所述新标签与疾病数据库中已有的数据标签进行加权统计,以得到统计结果;确定所述统计结果中分数最高的标签,并进行用户画像标签的标注。通过实施本发明专利技术实施例的方法可对诊疗数据进行挖掘,提升用户画像维度。提升用户画像维度。提升用户画像维度。

【技术实现步骤摘要】
基于诊疗数据的用户画像标签挖掘方法、装置及计算机设备


[0001]本专利技术涉及用户画像标签,更具体地说是指基于诊疗数据的用户画像标签挖掘方法、装置及计算机设备。

技术介绍

[0002]用户画像又称作用户角色,作为一种描述目标用户、联系用户需求的有效工具,用户画像在各领域均得到了广泛的应用。作为实际用户的虚拟形象,用户画像所形成的用户角色不是脱离产品和市场之外所虚构出来的,形成的用户角色需要有代表性,即能够代表产品的主要受众和目标群体。
[0003]但是目前大健康领域在构建用户画像的时候,没有和用户诊疗数据进行整合,无法完整构建用户的画像,存在信息缺失,画像不完整。
[0004]因此,有必要设计一种新的方法,实现对诊疗数据进行挖掘,提升用户画像维度。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供基于诊疗数据的用户画像标签挖掘方法、装置及计算机设备。
[0006]为实现上述目的,本专利技术采用以下技术方案:基于诊疗数据的用户画像标签挖掘方法,包括:
[0007]构建疾病数据库;
[0008]获取就诊文件的图片;
[0009]对所述图片进行文本识别,以得到患者信息;
[0010]将所述患者信息按照所述疾病数据库中节点对应的数据进行分类比较,以得到疾病及药物治疗标签;
[0011]将所述疾病及药物治疗标签、所述患者信息进行聚类分析,以确定强关联性的患者信息、疾病及药物治疗标签;
[0012]将强关联性的疾病及药物治疗标签作为用户标签进行存储,以得到新标签;
[0013]将所述新标签与疾病数据库中已有的数据标签进行加权统计,以得到统计结果;
[0014]确定所述统计结果中分数最高的标签,并进行用户画像标签的标注。
[0015]其进一步技术方案为:所述构建疾病数据库,包括:
[0016]采用图数据库创建疾病数据库;
[0017]将疾病诊断信息以及药物治疗方案作为节点进行存储;
[0018]对所述节点利用NLP自然语言处理技术进行拆词,将拆词后的结果作为数据标签并进行存储。
[0019]其进一步技术方案为:所述就诊文件包括病历及缴费清单文件。
[0020]其进一步技术方案为:所述对所述图片进行文本识别,以得到患者信息,包括:
[0021]利用OCR图像识别技术将所述图片转换为文本;
[0022]从所述文本中提取患者的相关数据,以得到患者信息。
[0023]其进一步技术方案为:所述患者信息包括姓名、性别、年龄、疾病以及治疗用药品。
[0024]本专利技术还提供了基于诊疗数据的用户画像标签挖掘装置,包括:
[0025]数据库构建单元,用于构建疾病数据库;
[0026]图片获取单元,用于获取就诊文件的图片;
[0027]文本识别单元,用于对所述图片进行文本识别,以得到患者信息;
[0028]比较单元,用于将所述患者信息按照所述疾病数据库中节点对应的数据进行分类比较,以得到疾病及药物治疗标签;
[0029]分析单元,用于将所述疾病及药物治疗标签、所述患者信息进行聚类分析,以确定强关联性的患者信息、疾病及药物治疗标签;
[0030]存储单元,用于将强关联性的疾病及药物治疗标签作为用户标签进行存储,以得到新标签;
[0031]加权统计单元,用于将所述新标签与疾病数据库中已有的数据标签进行加权统计,以得到统计结果;
[0032]标签确定单元,用于确定所述统计结果中分数最高的标签,并进行用户画像标签的标注。
[0033]其进一步技术方案为:所述数据库构建单元包括:
[0034]创建子单元,用于采用图数据库创建疾病数据库;
[0035]节点存储子单元,用于将疾病诊断信息以及药物治疗方案作为节点进行存储;
[0036]拆词子单元,用于对所述节点利用NLP自然语言处理技术进行拆词,将拆词后的结果作为数据标签并进行存储。
[0037]其进一步技术方案为:所述文本识别单元包括:
[0038]转换子单元,用于利用OCR图像识别技术将所述图片转换为文本;
[0039]提取子单元,用于从所述文本中提取患者的相关数据,以得到患者信息。
[0040]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0041]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0042]本专利技术与现有技术相比的有益效果是:本专利技术通过对就诊文件的图片文字识别后,提取患者信息,并将疾病数据库内的行为数据和就诊文件进行标签化挖掘,提升了用户画像的全面性,可找出患者诊疗和患者行为的相关性,实现对诊疗数据进行挖掘,提升用户画像维度。
[0043]下面结合附图和具体实施例对本专利技术作进一步描述。
附图说明
[0044]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘方法的应用场景示
意图;
[0046]图2为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘方法的流程示意图;
[0047]图3为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘方法的子流程示意图;
[0048]图4为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘方法的子流程示意图;
[0049]图5为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘装置的示意性框图;
[0050]图6为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘装置的数据库构建单元的示意性框图;
[0051]图7为本专利技术实施例提供的基于诊疗数据的用户画像标签挖掘装置的文本识别单元的示意性框图;
[0052]图8为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0053]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0054]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0055]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于诊疗数据的用户画像标签挖掘方法,其特征在于,包括:构建疾病数据库;获取就诊文件的图片;对所述图片进行文本识别,以得到患者信息;将所述患者信息按照所述疾病数据库中节点对应的数据进行分类比较,以得到疾病及药物治疗标签;将所述疾病及药物治疗标签、所述患者信息进行聚类分析,以确定强关联性的患者信息、疾病及药物治疗标签;将强关联性的疾病及药物治疗标签作为用户标签进行存储,以得到新标签;将所述新标签与疾病数据库中已有的数据标签进行加权统计,以得到统计结果;确定所述统计结果中分数最高的标签,并进行用户画像标签的标注。2.根据权利要求1所述的基于诊疗数据的用户画像标签挖掘方法,其特征在于,所述构建疾病数据库,包括:采用图数据库创建疾病数据库;将疾病诊断信息以及药物治疗方案作为节点进行存储;对所述节点利用NLP自然语言处理技术进行拆词,将拆词后的结果作为数据标签并进行存储。3.根据权利要求1所述的基于诊疗数据的用户画像标签挖掘方法,其特征在于,所述就诊文件包括病历及缴费清单文件。4.根据权利要求1所述的基于诊疗数据的用户画像标签挖掘方法,其特征在于,所述对所述图片进行文本识别,以得到患者信息,包括:利用OCR图像识别技术将所述图片转换为文本;从所述文本中提取患者的相关数据,以得到患者信息。5.根据权利要求1所述的基于诊疗数据的用户画像标签挖掘方法,其特征在于,所述患者信息包括姓名、性别、年龄、疾病以及治疗用药品。6.基于诊疗数据的用户画像标签挖掘装置,其特征在于,包括:数据库构建单元,用于构建疾病数据库;图片获取单元,用于获取就诊文件的图片;文本识...

【专利技术属性】
技术研发人员:周晓悦张启东
申请(专利权)人:杭州逸曜信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1