【技术实现步骤摘要】
乳腺癌风险因素知识体系模型、知识图谱系统及构建方法
[0001]本专利技术涉及大数据处理领域,具体涉及一种乳腺癌风险因素知识体系模型、基于知识体系的乳腺癌风险因素知识图谱系统及其构建方法,可应用于智慧医疗评估和风险预测等。
技术介绍
[0002]据2020最新全球癌症数据显示,乳腺癌已取代肺癌成为全球第一大癌,在造成女性死亡的癌症中排名第一。并且90%的恶性肿瘤早期无明显症状,发现时通常已是中晚期,因此,早发现、早预防、早治疗是防止癌症发生的重要手段。2019年9月,国家卫生健康委会同有关部门制定《健康中国行动——癌症防治实施方案(2019—2022年)》强调了癌症预防的重要性。由世界卫生组织国际癌症研究所出版的《世界癌症报告》2020版以癌症预防为核心内容,首次强调了不同地区因为癌症病因和人群的异质性导致相同癌症预防措施有不同防控效果.目前,我国仍缺乏乳腺癌的一级预防措施,还没有形成乳腺癌预防的风险分级管理指南。因此,对乳腺癌病因的研究是癌症预防工作的重要方向。
[0003]虽然过去几十年流行病学研究已发现众多乳腺 ...
【技术保护点】
【技术特征摘要】
1.一种乳腺癌风险因素知识体系模型,其特征在于,包括本体建立模块(1011)、数据获取模块(1012)、知识评价模块(1013)、关系分类模块(1014);所述本体建立模块(1011)根据自构本体和已有本体完成乳腺癌风险因素本体构建,从而建立一套以乳腺癌全病因为主的知识本体;所述数据获取模块(1012)用于从乳腺癌相关资源数据库中进行乳腺癌相关文献检索,自动检索乳腺癌病因知识,获得符合预设知识框架下的乳腺癌风险因素知识;所述知识评价模块(1013)用于对获取的知识依据证据维度进行循证医学证据等级评价;所述关系分类模块(1014)用于将风险因素与乳腺癌发病之间的关系强度进行分类。2.如权利要求1所述的一种乳腺癌风险因素知识体系模型,其特征在于,在本体建立模块(1011)中自构的乳腺癌风险因素本体的整体构建采用基于先验知识的从上至下建立框架和基于事实资源的从下之上补全知识相结合,同时自构的乳腺癌病因本体被映射至已有标准本体库。3.如权利要求1所述的一种乳腺癌风险因素知识体系模型,其特征在于,知识评价模块(1013)中采用两个维度进行知识评价:维度一为循证医学证据等级,维度二为引文网络,通过建立相关文献引文网络,根据文献被引频次、引用文献、信誉度信息进行文献价值排序。4.如权利要求1所述的一种乳腺癌风险因素知识体系模型,其特征在于,关系分类模块(1014)根据统计学指标对临床研究进行关系的强度分类;当某个关系没有或只有较弱的人类流行病学研究参考时,使用基于动物或机制的研究。5.一种基于乳腺癌风险因素知识体系的知识图谱系统,其特征在于,该系统包括实体识别模块(1021),关系抽取模块(1022),知识融合模块(1023)和知识推理模块(1024);实体识别模块(1021)用于从有关乳腺癌风险因素的研究文献中识别出病因实体;关系抽取模块(1022)用于根据识别出的实体抽取出实体之间的关系以此形成一定格式的组合;知识融合模块(1023)用于将抽取的三元组与异构的本体之间建立映射;知识推理模块(1024)用于推理新发现的知识、并不断更新和补全知识图谱。6.如权利要求5所述的一种基于乳腺癌风险因素知识体系的知识图谱系统,其特征在于,在关系抽取模块(1022)中,定义乳腺癌病因知识图谱中的三元组<h,r,t>∈F,h&t∈V,关系r∈E表示连接节点的边,对于给定的实体对h和t,预测实体对间可能存在的关系r从而获取知识表示,包括:(1)当关系r为上下位关系时:给定上下位词对(h,t),首先对t
–
h进行聚类,并对聚类得到的簇,学习映射矩阵Φ
k
如下式所示:其中,C
k
表示第k簇,N
k
表示第k簇中含有的上下位词对数,对于尚未确定的词对(h
′
,t
′
),若d(Φ
k
h
′
,t
′
)=‖Φ
k
h
′‑
t
′
‖2<δ,则词对(h
′
,t
′
)存在上下位关系;
(2)当关系r为横向关系时:若待抽取文本中只包含一个实体对,使用文...
【专利技术属性】
技术研发人员:彭玉兰,段磊,宋琳琳,左劼,刘晶焰,何承鑫,殷晋,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。