当前位置: 首页 > 专利查询>西南大学专利>正文

一种基于知识图谱的健康处方推荐方法技术

技术编号:39317818 阅读:5 留言:0更新日期:2023-11-12 16:00
本发明专利技术涉及数据获取技术领域,具体涉及一种基于知识图谱的健康处方推荐方法,包括从数据源中自动抽取三元组知识,构建健康处方知识图谱;基于所述健康处方知识图谱采用推荐算法获取推荐处方,本发明专利技术自动抽取健康领域文本资料中的三元组关系,形成可用的多源多维多态信息融合的复杂健康知识图谱。健康知识图谱采用先进的技术手段,通过大数据分析和深度学习模型构建,能够为人们提供广泛的、全面的健康知识服务,满足人们在日常生活中对健康的种种需求,在原有的用户交互数据基础之上融入健康知识图谱中的语义关系,发掘推荐过程中处方之间的隐语义关系,提高系统的推荐效果。解决了现有的推荐方法的推荐的精确度低的问题。有的推荐方法的推荐的精确度低的问题。有的推荐方法的推荐的精确度低的问题。

【技术实现步骤摘要】
一种基于知识图谱的健康处方推荐方法


[0001]本专利技术涉及数据获取
,尤其涉及一种基于知识图谱的健康处方推荐方法。

技术介绍

[0002]当前,由于信息时代的发展,现在主流的健康类网站平台提供的健康知识庞大无比,这却也导致了用户容易遭受“信息过载”的困扰。因此,健康处方推荐系统应运而生。健康处方推荐方法旨在为患者提供个性化的健康处方和指导,帮助他们管理健康问题和改善健康状况。该方法是医学健康知识和人工智能技术的一种有机结合。
[0003]多源、多维、多态的健康领域数据难以获取和利用。当前互联网上的健康知识存在分布不均匀、知识规模小、知识更新不及时等问题,且不同平台之间的数据无法互通和互认,数据质量也层次不齐,就像一个个“数据孤岛”。事实上,上述数据基本上都是以非结构化的形式存在的,人们很难从这些海量数据中挖掘出真正有用的信息,很难将数据转变为知识,无法被计算机直接高效地处理和利用。因此如何从这些数据中获取大量知识并为其增加价值以服务于健康领域是一个关键的科学问题。
[0004]传统基于协同过滤的健康处方推荐方法不能充分挖掘处方之间的隐含语义关系。在当前众多的健康资讯网站中,缺乏个性化推荐与健康处方相关的内容,如饮食、运动与健康之间的功能、禁忌、适宜病症等。此外,传统推荐网站仅考虑用户的内容交互记录,往往无法充分挖掘内容之间的隐含语义关系,从而影响推荐效果。因此,如何充分发掘出健康处方推荐过程中隐含的处方语义关系也是一个关键的科学问题。
[0005]因此,现有的推荐方法的数据获取效果和推荐效果差,降低了推荐的精确度。

技术实现思路

[0006]本专利技术的目的在于提供一种基于知识图谱的健康处方推荐方法,旨在解决现有的推荐方法的推荐的精确度低的问题。
[0007]为实现上述目的,本专利技术提供了一种基于知识图谱的健康处方推荐方法,包括以下步骤:
[0008]从数据源中自动抽取三元组知识,构建健康处方知识图谱;
[0009]基于所述健康处方知识图谱采用推荐算法获取推荐处方。
[0010]其中,所述从数据源中自动抽取三元组知识,构建知识图谱,包括:
[0011]从数据源中构建知识抽取数据集;
[0012]对所述知识抽取数据集进行知识抽取,得到三元组知识;
[0013]将所述三元组知识进行知识融合,消除数据冗余和数据错误,得到融合数据;
[0014]对所述融合数据进行知识推理,得到补全知识图谱;
[0015]对所述补全知识图谱进行质量评估,得到健康处方知识图谱。
[0016]其中,所述知识抽取数据集包括结构化数据、半结构化数据和非结构化数据。
[0017]其中,所述推荐算法包括KGD

CF算法。
[0018]其中,所述基于所述健康处方知识图谱采用推荐算法获取推荐处方,包括:
[0019]对所述健康处方知识图进行表示学习,得到处方之间的语义向量表示;
[0020]基于所述处方之间的语义向量表示计算处方之间的语义相似度与用户交互数据得到的处方协同相似度;
[0021]融合所述处方语义相似度与所述处方协同相似度,得到融合相似度;
[0022]基于所述融合相似度计算每个用户的处方兴趣度,进行排名;
[0023]基于所述排名采用Top

N原理给用户推荐出前N个处方。
[0024]本专利技术的一种基于知识图谱的健康处方推荐方法,通过从数据源中自动抽取三元组知识,构建健康处方知识图谱;基于所述健康处方知识图谱采用推荐算法获取推荐处方,本专利技术自动抽取健康领域文本资料中的三元组关系,形成可用的多源多维多态信息融合的复杂健康知识图谱。健康知识图谱采用先进的技术手段,通过大数据分析和深度学习模型构建,能够为人们提供广泛的、全面的健康知识服务,满足人们在日常生活中对健康的种种需求,在原有的用户交互数据基础之上融入健康知识图谱中的语义关系,发掘推荐过程中处方之间的隐语义关系,提高系统的推荐效果。解决了现有的推荐方法的推荐的精确度低的问题。
附图说明
[0025]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]图1是本专利技术提供的一种基于知识图谱的健康处方推荐方法的整体框架图。
[0027]图2是知识抽取的流程图。
[0028]图3是知识融合的流程图。
[0029]图4是本专利技术提供的一种基于知识图谱的健康处方推荐方法的流程图。
具体实施方式
[0030]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0031]请参阅图1至图4,本专利技术提供一种基于知识图谱的健康处方推荐方法,包括以下步骤:
[0032]S1从数据源中自动抽取三元组知识,构建健康处方知识图谱;
[0033]具体方式为:
[0034]S11从数据源中构建知识抽取数据集;
[0035]具体的,所述知识抽取数据集包括结构化数据、半结构化数据和非结构化数据。
[0036]定义健康知识图谱模式层。模式层是整个知识图谱的概念模型和逻辑基础,它为数据层中的数据提供了组织范式,一般使用本体作为知识图谱的模式层,并通过本体定义
的规则来约束知识图谱的数据层。通过模式层设计确定领域知识图谱类层次结构、类关系、类领域、类属性。
[0037]数据获取及数据集构建。本专利技术从互联网和专业书籍中获取健康领域数据,需要根据“知识抽取”中不同的知识抽取任务,参考“定义健康知识图谱模式层”中定义的数据模式做不同的数据标注。针对命名实体识别任务,使用BIOS序列标注法进行实体标注;针对实体关系识别任务,需要标注包括关系类别、实体名称、实体类型、实体起始位置和实体截止位置。
[0038]S12对所述知识抽取数据集进行知识抽取,得到三元组知识;
[0039]具体的,知识抽取。对“定义健康知识图谱模式层”中标注好的数据进行知识抽取,图2是知识抽取的流程图。对文本数据进行命名实体识别获得该文本数据的实体集合,对其中两两实体对进行遍历。为了节省计算资源并更快的返回结果,在实体关系识别之前可以先去判断两者是否可能存在关系,如果不存在则直接跳过该实体对,不做计算。
[0040]本专利技术提出一种命名实体识别:
[0041](1)使用RoBERTa对输入的文本序列建模,得到该文本序列的语义编码信息。RoBERTa对输入的文本序列w=[w1,w2,

,w
n
]建模得到该文本序列的语义本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的健康处方推荐方法,其特征在于,包括以下步骤:从数据源中自动抽取三元组知识,构建健康处方知识图谱;基于所述健康处方知识图谱采用推荐算法获取推荐处方。2.如权利要求1所述的基于知识图谱的健康处方推荐方法,其特征在于,所述从数据源中自动抽取三元组知识,构建知识图谱,包括:从数据源中构建知识抽取数据集;对所述知识抽取数据集进行知识抽取,得到三元组知识;将所述三元组知识进行知识融合,消除数据冗余和数据错误,得到融合数据;对所述融合数据进行知识推理,得到补全知识图谱;对所述补全知识图谱进行质量评估,得到健康处方知识图谱。3.如权利要求2所述的基于知识图谱的健康处方推荐方法,其特征在于,所述知识抽取数据集包括结构化数据、半结...

【专利技术属性】
技术研发人员:张衡黄奔皓许仁园
申请(专利权)人:西南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1