【技术实现步骤摘要】
一种基于知识图谱的中医药古籍可视分析方法与系统
[0001]本专利技术涉及中医药古籍可视分析领域,具体涉及一种基于知识图谱的中医药古籍可视分析方法与系统。
技术背景
[0002]中医药古代典籍是中医药学的重要载体,对中医药学的传承和发展起着重要的作用。研究人员深入探索与分析分散在古籍中的知识需要花费大量的精力。近年来,中医药领域信息化程度不断提高,方便研究人员探索古籍中的知识。有不少工作通过HMM[参见:Lafferty J D,Mccallum A K,Pereira F.Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data.2001.]、CRF[参见:Lafferty J D,Mccallum A K,Pereira F.Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data.2 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的中医药古籍可视分析方法,其特征在于,包括以下步骤:S1、对中医药古籍文本数据进行预处理,得到命名实体识别训练数据集和关系抽取训练数据集;S2、基于深度学习网络模型生成中医药古籍知识图谱;S3、构建中医药古籍可视化分析系统,进行古籍知识图谱可视化、症状聚类可视化、药材可视化和药方可视化;S4、配置用户可视化交互式接口,基于所述中医药古籍可视化分析系统,根据用户输入信息反馈并展示可视化信息。2.根据权利要求书1所述的基于知识图谱的中医药古籍可视分析方法,其特征在于,步骤S1具体包括:S11、对古籍文本中的停用字、繁体字进行转换,然后将古籍按文本结构切分成语义关联的结构化、半结构化短句集;S12、使用模板规则以及人工标注的方法对所述短句集进行处理,最终得到命名实体识别训练数据集和关系抽取训练数据集。3.根据权利要求书1所述的基于知识图谱的中医药古籍可视分析方法,其特征在于,步骤S2具体包括:S21、基于四库全书BERT、Bi
‑
LSTM、CRF模型,搭建命名实体识别网络,并使用所述命名实体识别训练数据集对所述命名实体识别网络进行训练;S22、基于四库全书BERT、增强PCNN模型,搭建关系抽取网络,并使用所述关系抽取训练数据集对所述关系抽取网络进行训练;S23、使用所述命名实体识别网络和关系抽取网络对新输入的中医药古籍进行命名实体识别及关系抽取,分别得到实体集和RDF三元组;S24、将所述实体集和RDF三元组存入Neo4j数据库,生成中医药古籍知识图谱。4.根据权利要求书3所述的基于知识图谱的中医药古籍可视分析方法与系统,其特征在于,步骤S3具体包括:S31、古籍知识图谱可视化:以不同类型的节点代表不同的实体,以边代表实体间的关系,将中医药古籍知识图谱进行可视化;S32、症状聚类可视化:使用四库全书BERT模型对症状进行向量化,然后对向量进行降维和聚类,以散点图中的点表示症状、以颜色表示症状的类别,对古籍中的症状进行可视化;S33、药材可视化:显示药材的形态、主治、性效、用法、功效,并对配伍药材的适应症进行统计,绘制出适应症比例;S34、药方可视化:显示选中药方的文本...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。