【技术实现步骤摘要】
一种老年健康领域知识问答系统构建方法
本专利技术涉及养老服务
,特别涉及一种老年健康领域知识问答系统构建方法。
技术介绍
人口老龄化是当今世界很多国家面临的人口问题,老年人的健康问题也愈发受到社会的关注。随着医疗健康研究工作和信息技术的发展,老年人的医疗健康的相关知识开始在网上慢慢积累起来,比如各大百科平台,关于医疗健康的网站等等。这些信息大多以结构化或非结构化的方式存储于传统关系型数据库中。这种存储方式往往不利于对数据进行挖掘,这就意味着数据的服务能力不足。因此,对老年人相关的医疗健康知识进行良好的存储和分析,以提供更好的服务是当今健康医疗领域重要的挑战。近几年来,知识谱图由于其相对于传统存储方式具有更好的知识推理的逻辑结构能力,变得愈发的火热。知识谱图通过结点和边的关系将海量的知识构建成一个巨大的知识网络,将散碎的知识联系起来,为用户提供知识检索,推荐等服务。自从Google在2012年使用知识图谱技术在搜索领域带来提升之后,百度、搜狗、微软等巨头在知识图谱领域纷纷跟进,百度知心、搜狗知立方、微软人立方产品随即问市。但是这些知识图谱都是面向开放性领域的, ...
【技术保护点】
1.一种老年健康领域知识问答系统构建方法,其特征在于:包括以下步骤:(1)建立老年健康领域数据模型通过百科网站和医疗健康的网站提取用户对老年科的疾病所提的问题,根据老年科的疾病所提的问题建立老年健康领域数据模型;(2)老年健康领域知识的获取通过老年健康领域数据模型抽取老年健康领域结构化数据、半结构化数据和非机构化数据的实体与关系;(3)老年健康领域知识的融合将从老年健康领域数据模型不同源抽取到的老年健康领域的实体和关系进行融合,所述老年健康领域的实体和关系进行融合的主要原则为选择来源更可信的知识以及选择来源更多的知识;(4)老年健康领域知识的存储通过三元组的方式对步骤(3) ...
【技术特征摘要】
1.一种老年健康领域知识问答系统构建方法,其特征在于:包括以下步骤:(1)建立老年健康领域数据模型通过百科网站和医疗健康的网站提取用户对老年科的疾病所提的问题,根据老年科的疾病所提的问题建立老年健康领域数据模型;(2)老年健康领域知识的获取通过老年健康领域数据模型抽取老年健康领域结构化数据、半结构化数据和非机构化数据的实体与关系;(3)老年健康领域知识的融合将从老年健康领域数据模型不同源抽取到的老年健康领域的实体和关系进行融合,所述老年健康领域的实体和关系进行融合的主要原则为选择来源更可信的知识以及选择来源更多的知识;(4)老年健康领域知识的存储通过三元组的方式对步骤(3)选取的实体和关系进行存储以构建老年健康领域知识图谱;(5)自动问答系统算法根据用户数据输入问题的类别、用户历史问答信息和老年健康领域的知识图谱提供构建老年健康领域知识问答系统。2.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的半结构化数据实体和关系的方法为:首先,所述结构化数据通过D2R的映射将表名转化成对应的实体,其次,所述结构化数据通过D2R的映射将行数据的主键转化成资源的主键,最后,所述结构化数据通过D2R的映射将列数据及外键数据转化成对应的属性形成三元组数据。3.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的半结构化数据实体和关系的方法为:所述半结构化数据通过包装器从百科网站数据和老年健康相关网站的页面进行分析后爬取实体和关系。4.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的非结构化数据实体和关系的方法为:所述非结构化数据通过斯坦福自然语言处理NLP工具进行分词并使用实体链接技术将文本中候选实体链接到本地的知识库,当不存在斯坦福自然语言处理NLP工具进行分词的实体时,所述非结构化数据通过命名实体识别进行实体的抽取。5.根据权利要求4所述的老年健康领域知识问答系统构建方法,其特征在于:所述结构化数据通过命名实体识别进行实体的抽取的方法为:通过基于统计学的方法将老年健康领域数据模型中识别实体间关系的问题转化为分类问题,以老年健康领域数据模型中实体之间关系作为标签,以老年健康领域数据模型中两个实体之间的关系作为训练样本,选取合适的特征,放入到分...
【专利技术属性】
技术研发人员:初佃辉,高见,李春山,申义,黎阳,王涛,
申请(专利权)人:威海天鑫现代服务技术研究院有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。