【技术实现步骤摘要】
基于中医药领域专业词向量的中药处方用药安全检测方法
本专利技术涉及中医药、用药安全
,具体为基于中医药领域专业词向量的中药处方用药安全检测方法。
技术介绍
为了构件专业的中药处方用药安全系统,首先需要构建方药风险信息库,随着互联网技术的快速发展和信息获取的飞速增长,互联网上产生了大量的中医药相关的词条信息,所以,从互联网上抓取中医药相关的词条信息是一种快速构建方药风险信息库的有效途径。随着人们对于从海量词汇中检索目标词汇的需求愈加迫切,通过搜索引擎,如google和百度,都提供了中医药相关的词条信息的检索功能,包括基于文本的词汇检索和基于内容的词汇检索。所以,可以利用通过搜索引擎提供的基于文本的词汇检索功能来快速地构建方药风险信息库,但是直接抓取通过搜索引擎检索的结果,效果并不理想。分析正确中医药相关的词条信息所在的源网页和不正确中医药相关的词条信息所在的源网页,容易发现非目标网页的文本内容与中医药的关系并不大,甚至完全没有关系,由于方药风险信息库构建不完善,导致中药配伍禁忌、毒性和不良反应信息不能够有效准确的获得,使 ...
【技术保护点】
1.基于中医药领域专业词向量的中药处方用药安全检测方法,其特征在于:包括如下步骤:/n1)首先爬取百科网站上中医药相关的词条信息;/n2)提取中药材、方剂的公开信息,进行筛选、过滤、去重,建立本地词料信息库;/n3)将第2步所得的词条去掉停用词,构建Word2Vec的训练集;/n4)训练Word2Vec模型,构造词向量矩阵;/n5)对于每一条中药材、方剂词条信息,利用谷歌、百度等通用搜索引擎提供的文本检索功能,获取其配伍禁忌、毒性、不良反应信息和它们所在源网页的内容;/n6)对于第5步中得到的每一个源网页,去掉包括HTML标签、JS代码、CSS代码的内容,然后利用CRF模型 ...
【技术特征摘要】
1.基于中医药领域专业词向量的中药处方用药安全检测方法,其特征在于:包括如下步骤:
1)首先爬取百科网站上中医药相关的词条信息;
2)提取中药材、方剂的公开信息,进行筛选、过滤、去重,建立本地词料信息库;
3)将第2步所得的词条去掉停用词,构建Word2Vec的训练集;
4)训练Word2Vec模型,构造词向量矩阵;
5)对于每一条中药材、方剂词条信息,利用谷歌、百度等通用搜索引擎提供的文本检索功能,获取其配伍禁忌、毒性、不良反应信息和它们所在源网页的内容;
6)对于第5步中得到的每一个源网页,去掉包括HTML标签、JS代码、CSS代码的内容,然后利用CRF模型与最长单词匹配方法相组合进行分词,去掉停用词,得到源网页的文本信息;
7)利用第6步所得文本和第4步得到的词向量矩阵训练Doc...
【专利技术属性】
技术研发人员:阮晓龙,许成刚,高海波,王昂,
申请(专利权)人:河南中医药大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。