【技术实现步骤摘要】
一种基于知识图谱推理的医疗智能问答处理方法及系统
[0001]本专利技术属于知识图谱自然语言处理领域,尤其是涉及一种基于知识图谱推理的医疗智能问答处理系统及系统。
技术介绍
[0002]现有的医疗管理系统,均是面向于搜索来实现医疗信息检索的,其原理是通过搜索的方式来实现字符的比对,以此满足用户的需求。因此现有的产品的搜索功能不是很精准,难以处理较为复杂的数据,以至于最后提供给用户的信息可能达不到用户的要求,出现“答非所问”的情况;再者此类产品仍然不能做到对用户的智能问答。所以目前还没有产品可以将智能搜索、智能推荐、智能问答结合到一起形成一个较为完善的系统。
技术实现思路
[0003]有鉴于此,本专利技术旨在提出一种基于知识图谱的医疗智能问答系统,具有方便、精准的优点。
[0004]为达到上述目的,本专利技术的技术方案是这样实现的:
[0005]一种基于知识图谱推理的医疗智能问答处理方法,包括如下步骤:
[0006]步骤1:获取用户的原始问题;
[0007]步骤2:将用户的原始问 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:包括如下步骤:步骤1:获取用户的原始问题;步骤2:将用户的原始问题解析成用户意图以及用户意图对应的语义特征;步骤3:对用户的原始问题中的多种语义特征进行目标实体识别得到目标实体;步骤4:根据得到的目标实体生成包含正确答案的路径;步骤5:对于每个候选答案路径进行排序,将生成的答案返回给用户。2.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图包括判断输入的问题的领域,所述领域包括医疗领域和通用领域,通过将预训练模型ALBert与Bi
‑
GRU模型结合,再将其结果输入到Attention结构中,最后将特征重标定以后的向量输入到全连接层进行分类。3.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图还包括平衡样本数据的步骤,通过使用SeqGAN文本生成模型对医疗问句进行续写增加医疗问句的数量,将医疗问句的句内次序打乱生成更多的医疗问句数据,以及引入Focal Loss损失函数。4.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图对应的语义特征中,通过单多跳分类模型得到单多跳语义特征,然后通过主谓宾分类模型得到主谓宾语义特征,最后通过链式分类模型得到链式特征。5.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤3中目标实体识别包括实体提及识别、属性提及识别、以及实体链接;所述实体提及识别包括通过词典分词进行实体的识别,通过实体命名识别模型去召回实体提及,以及通过启发式的方案去识别实体提及;所述属性提及识别中针对不同类型的属性值,采用不同的方式进行识别,包括书籍名称、数字,时间属性以及模糊属性匹配;所述实体链接中包括对候选实体挖掘多组特征,基于多组特征使用排序模型找到问题中的焦点实体。6.根据权利要求4所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤4中,首先根据单多跳分类模型、链式分类模型、主谓宾分类...
【专利技术属性】
技术研发人员:贾勇哲,马国宁,王林,徐大为,贺斌,
申请(专利权)人:天津泰凡科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。