基于中医药领域专业词向量的中药处方用药安全检测方法技术

技术编号:25954804 阅读:51 留言:0更新日期:2020-10-17 03:47
本发明专利技术公开了基于中医药领域专业词向量的中药处方用药安全检测方法,包括如下步骤:首先爬取百科网站上中医药相关的词条信息;提取中药材、方剂的公开信息;构建Word2Vec的训练集;训练Word2Vec模型,构造词向量矩阵;对于每一条中药材、方剂词条信息,利用通用搜索引擎提供的文本检索功能,获取其配伍禁忌、毒性、不良反应信息和它们所在源网页的内容;然后利用CRF模型与最长单词匹配方法相组合进行分词,去掉停用词,更新文档向量,训练完后便得到各源网页的文档向量;选出相似度高于预设阈值的风险信息集建立方药风险信息库,根据输入的方药内容,根据输入的患者特征,检索方药风险信息库,进行配伍禁忌匹配,同时进行毒性检测,不良反应检测。

【技术实现步骤摘要】
基于中医药领域专业词向量的中药处方用药安全检测方法
本专利技术涉及中医药、用药安全
,具体为基于中医药领域专业词向量的中药处方用药安全检测方法。
技术介绍
为了构件专业的中药处方用药安全系统,首先需要构建方药风险信息库,随着互联网技术的快速发展和信息获取的飞速增长,互联网上产生了大量的中医药相关的词条信息,所以,从互联网上抓取中医药相关的词条信息是一种快速构建方药风险信息库的有效途径。随着人们对于从海量词汇中检索目标词汇的需求愈加迫切,通过搜索引擎,如google和百度,都提供了中医药相关的词条信息的检索功能,包括基于文本的词汇检索和基于内容的词汇检索。所以,可以利用通过搜索引擎提供的基于文本的词汇检索功能来快速地构建方药风险信息库,但是直接抓取通过搜索引擎检索的结果,效果并不理想。分析正确中医药相关的词条信息所在的源网页和不正确中医药相关的词条信息所在的源网页,容易发现非目标网页的文本内容与中医药的关系并不大,甚至完全没有关系,由于方药风险信息库构建不完善,导致中药配伍禁忌、毒性和不良反应信息不能够有效准确的获得,使得中药配伍禁忌、毒性本文档来自技高网...

【技术保护点】
1.基于中医药领域专业词向量的中药处方用药安全检测方法,其特征在于:包括如下步骤:/n1)首先爬取百科网站上中医药相关的词条信息;/n2)提取中药材、方剂的公开信息,进行筛选、过滤、去重,建立本地词料信息库;/n3)将第2步所得的词条去掉停用词,构建Word2Vec的训练集;/n4)训练Word2Vec模型,构造词向量矩阵;/n5)对于每一条中药材、方剂词条信息,利用谷歌、百度等通用搜索引擎提供的文本检索功能,获取其配伍禁忌、毒性、不良反应信息和它们所在源网页的内容;/n6)对于第5步中得到的每一个源网页,去掉包括HTML标签、JS代码、CSS代码的内容,然后利用CRF模型与最长单词匹配方法相...

【技术特征摘要】
1.基于中医药领域专业词向量的中药处方用药安全检测方法,其特征在于:包括如下步骤:
1)首先爬取百科网站上中医药相关的词条信息;
2)提取中药材、方剂的公开信息,进行筛选、过滤、去重,建立本地词料信息库;
3)将第2步所得的词条去掉停用词,构建Word2Vec的训练集;
4)训练Word2Vec模型,构造词向量矩阵;
5)对于每一条中药材、方剂词条信息,利用谷歌、百度等通用搜索引擎提供的文本检索功能,获取其配伍禁忌、毒性、不良反应信息和它们所在源网页的内容;
6)对于第5步中得到的每一个源网页,去掉包括HTML标签、JS代码、CSS代码的内容,然后利用CRF模型与最长单词匹配方法相组合进行分词,去掉停用词,得到源网页的文本信息;
7)利用第6步所得文本和第4步得到的词向量矩阵训练Doc...

【专利技术属性】
技术研发人员:阮晓龙许成刚高海波王昂
申请(专利权)人:河南中医药大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1