【技术实现步骤摘要】
一种基于医疗知识图谱的疾病自动问答系统、设备及介质
[0001]本专利技术涉及疾病学习和问答领域,尤其涉及一种基于医疗知识图谱的疾病自动问答系统、设备及介质。
技术介绍
[0002]近年来人们生活水平得到了普遍提高,相较以往成为了人们愈发关注自身和家人的健康问题,而在日常生活中,人们经常需要根据自身所得症状确定自己可能患有的疾病,并需要针对这类疾病进行准确挂号、合理用药、日常诊疗等操作。目前在线医疗咨询平台如寻医问药网、好大夫在线网等能够进行相关疾病咨询,但这类平台需要医生在线,通过人工答诊的方式为患者提供咨询服务,导致这类在线咨询平台缺乏自动智能化问诊与答诊的途径,无法为大量的患者提供及时的疾病咨询服务。
[0003]随着“互联网+”技术以及智慧医疗的迅速发展,疾病自动问答系统逐渐成为人与机器进行自然交互的新方式,知识图谱(Knowledge Graphs)是大规模语义网络知识库,采取符号化的知识表示方式,利用三元组来描述具体的知识,并以有向图的形式对其进行表示和存储,具有语义丰富、结构友好、易于理解等优点,由于在 ...
【技术保护点】
【技术特征摘要】
1.一种基于医疗知识图谱的疾病自动问答系统,其特征在于,所述一种基于医疗知识图谱的疾病自动问答系统包括以下功能模块:知识图谱构建模块:用于搭建基于医学知识图谱MedKG的疾病自动问答系统后台知识总库;疾病问句特征选择模块:用于对用户病情提问语句中的疾病特征词进行识别,完成疾病特征词到词向量的转化;知识图谱嵌入模块:用于建立与所述疾病特征词相关联的医学知识图谱内实体及实体关系到低维向量的空间投影,生成关联实体向量;多通道卷积神经网络模块:用于将疾病特征词向量与相关知识实体向量作为多通道输入网络模型进行训练,实现预测功能;自动化部署模块:用于将各核心功能封装及压缩模型,上传云服务器完成访问路径、端口参数、并发上限的配置,供客户端实时调用。2.如权利要求1所述的一种基于医疗知识图谱的疾病自动问答系统,其特征在于,所述知识图谱构建模块具体包括:知识获取单元:利用爬虫采集技术从多个医疗在线问答服务平台获取相关的疾病数据并作为所述医学知识图谱的数据源;数据预处理单元:进行数据格式转换和数据过滤处理,数据格式转换为:将所述知识获取单元中获取的疾病数据通过订制脚本文件批量转换为适合入库的数据格式;数据过滤为:对异常数据进行过滤筛选,使经过数据格式转换处理的数据格式规整、准确统一,所述异常数据包括空值、重复值和无关标点;知识抽取单元:抽取所述数据预处理单元处理完成的数据完成疾病相关的实体、关系和属性,构建疾病知识图谱三元组<head,relation,tail>,head、tail分别为三元组的头实体、尾实体,都属于MedKG的实体集合,relation={r1,r1,
…
,r
R
}是MedKG的关系集合,共包含R种不同关系,医疗实体head和tail作为MedKG中最基本的元素,而关系relation存在于不同head或tail之间;实体消歧单元:对所述知识抽取单元中存在来源不同疾病却相同或同义的多源开放疾病数据,通过消歧操作确保实体唯一;所述消歧操作包括重复实体名删除、实体名同义互换;知识存储单元:通过图形数据库Neo4j实现疾病数据的存储和疾病知识图谱的可视化。3.如权利要求2所述的一种基于医疗知识图谱的疾病自动问答系统,其特征在于,所述疾病问句特征选择模块具体包括:所述用户病情提问语句包括用户对自身疾病症状、病因以及严重程度相关的描述语句;使用THULAC中文分词系统结合医疗专业疾病与症状词典,对用户病情提问语句进行分词、词性标注及识别医疗实体处理,并通过去除停用词及无意义的单字,得到一组与病情描述相关的疾病特征词;一条由n个特征词构成的疾病特征为x={w1,w2,
…
,w
n
},其中w
i
为构成一条完整疾病语句中第i个位置的特征词;利用word2vec的CBOW模型训练得到每个特征词转换后的词向量,即映射为对应的d维表示向量w
1:n
∈R
d
。4.如权利要求3所述的一种基于医疗知识图谱的疾病自动问答系统,其特征在于,所述
知识图谱嵌入模块具体包括:基于实体链接EL技术将所述疾病问句特征选择模块中分词后的疾病特征x={w1,w2,
…
,w
n
},与知识图谱构建模块构建的知识图谱MedKG三元组<head,relation,tail>进行实体相似性计算,得出MedKG内相关实体及实体关系数据信息,进而构造疾病特征x={w1,w2,
…
,w
n...
【专利技术属性】
技术研发人员:李宗博,杜登斌,杜乐,杜小军,
申请(专利权)人:吾征智能技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。