一种文本描述信息识别系统和方法技术方案

技术编号:36708771 阅读:14 留言:0更新日期:2023-03-01 09:33
本申请公开了一种文本描述信息识别系统和方法。所述系统包括:数据采集模块,用于采集头痛现象描述信息和头痛起因描述信息;特征提取模块,用于采用自然语言处理算法对所述头痛现象描述信息和所述头痛起因描述信息提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及文本识别模块,用于采用决策树算法根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。本申请解决相关技术中关于头痛的识别效率低和识别准确率低的技术问题。问题。问题。

【技术实现步骤摘要】
一种文本描述信息识别系统和方法


[0001]本申请涉及文本信息识别
,具体而言,涉及一种文本描述信息识别系统和方法。

技术介绍

[0002]中医头痛是临床常见症状,可见于多种疾病之中,这里处所讨论的头痛,因外感六淫、内伤杂病而引起,以头痛为主要症状,不包括某种疾病的兼证头痛。头痛会有很多不同的表现,诊断起来有时会非常困难。特别是中医还涉及到辨证分型以及论证,若仅靠经验进行诊断。
[0003]针对相关技术中中医头痛的识别效率低、识别准确率低的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请的主要目的在于提供一种文本描述信息识别系统和方法,以解决相关技术中关于头痛的识别效率低和识别准确率低的问题。
[0005]为了实现上述目的,第一方面,本申请提供了一种文本描述信息识别系统,该系统包括:数据采集模块,用于采集头痛现象描述信息和头痛起因描述信息;特征提取模块,用于采用自然语言处理算法对所述头痛现象描述信息和所述头痛起因描述信息提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及文本识别模块,用于采用决策树算法根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。
[0006]根据本申请的文本描述信息识别系统,所述数据采集模块还用于采集第一训练信息和第二训练信息,所述第一训练信息包括头痛训练现象信息、头痛起因训练信息,所述第二训练信息包括与所述头痛训练现象信息和所述头痛起因训练信息相关联的头痛训练结果、方案训练信息和方剂训练信息;所述特征提取模块还用于采用所述自然语言处理算法对所述第一训练信息和所述第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料;该系统还包括:模型训练模块,用于采用决策树算法根据所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料进行模型训练,以得到文本识别模型;其中,所述文本识别模块还用于采用所述文本识别模型根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。
[0007]根据本申请的文本描述信息识别系统,该系统还包括归一化模块,用于:对所述头痛现象描述信息和所述头痛起因描述信息进行归一化,以得到归一化后的头痛现象描述信息和头痛起因描述信息,其中,所述特征提取模块还用于采用自然语言处理算法对归一化后的头痛现象描述信息和头痛起因描述信息分别提取关键特征分词和关键特征语料,以得
到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及对所述第一训练信息和所述第二训练信息进行归一化,以得到归一化后的第一训练信息和第二训练信息,其中,所述特征提取模块还用于采用自然语言处理算法对归一化后的第一训练信息和第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料。
[0008]根据本申请的文本描述信息识别系统,所述头痛现象描述信息和所述头痛训练现象信息包括头痛的发生位置、疼痛性质和发作形式;所述头痛起因描述信息和所述头痛起因训练信息包括外感和内伤;所述头痛识别结果和所述头痛训练结果包括风热头痛、风湿头痛、肝阳头痛和血虚头痛;所述方案描述信息和所述方案训练信息包括宜疏风清热和络、宜祛风胜湿通窍、宜平肝潜阳息风和宜养血滋阴活络止痛;以及所述方剂描述信息和所述方剂训练信息包括芎芷石膏汤加减、羌活胜湿汤加减、天麻钩藤饮加减和加味四物汤加减。
[0009]根据本申请的文本描述信息识别系统,该系统还包括特征存储模块,用于:存储所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料,以形成信息库;以及存储所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料以及所述第一训练信息与所述第二训练信息之间的关联关系,以形成知识库。
[0010]第二方面,本申请还提供了一种文本描述信息识别方法,该方法包括:采集头痛现象描述信息和头痛起因描述信息;采用自然语言处理算法对所述头痛现象描述信息和所述头痛起因描述信息提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及采用决策树算法根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。
[0011]根据本申请的文本描述信息识别方法,该方法还包括:采集第一训练信息和第二训练信息,所述第一训练信息包括头痛训练现象信息、头痛起因训练信息,所述第二训练信息包括与所述头痛训练现象信息和所述头痛起因训练信息相关联的头痛训练结果、方案训练信息和方剂训练信息;采用所述自然语言处理算法对所述第一训练信息和所述第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料;采用决策树算法根据所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料进行模型训练,以得到文本识别模型;以及采用所述文本识别模型根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。
[0012]根据本申请的文本描述信息识别方法,该方法还包括:对所述头痛现象描述信息和所述头痛起因描述信息进行归一化,以得到归一化后的头痛现象描述信息和头痛起因描述信息,其中,采用自然语言处理算法对归一化后的头痛现象描述信息和头痛起因描述信息分别提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及对所述第一训练信息和所述第二训练信息进行归一化,以得到归一化后的第一训练信息和第二训练信息,其中,采用自然语言处理算法对归一化后的第一训练信息和第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料。
[0013]根据本申请的文本描述信息识别方法,所述头痛现象描述信息和所述头痛训练现
象信息包括头痛的发生位置、疼痛性质和发作形式;所述头痛起因描述信息和所述头痛起因训练信息包括外感和内伤;所述头痛识别结果和所述头痛训练结果包括风热头痛、风湿头痛、肝阳头痛和血虚头痛;所述方案描述信息和所述方案训练信息包括宜疏风清热和络、宜祛风胜湿通窍、宜平肝潜阳息风和宜养血滋阴活络止痛;以及所述方剂描述信息和所述方剂训练信息包括芎芷石膏汤加减、羌活胜湿汤加减、天麻钩藤饮加减和加味四物汤加减。
[0014]根据本申请的文本描述信息识别方法,该方法还包括:存储所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料,以形成信息库;以及存储所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料以及所述第一训练信息与所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本描述信息识别系统,其特征在于,该系统包括:数据采集模块,用于采集头痛现象描述信息和头痛起因描述信息;特征提取模块,用于采用自然语言处理算法对所述头痛现象描述信息和所述头痛起因描述信息提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及文本识别模块,用于采用决策树算法根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。2.如权利要求1所述的文本描述信息识别系统,其特征在于,所述数据采集模块还用于采集第一训练信息和第二训练信息,所述第一训练信息包括头痛训练现象信息、头痛起因训练信息,所述第二训练信息包括与所述头痛训练现象信息和所述头痛起因训练信息相关联的头痛训练结果、方案训练信息和方剂训练信息;所述特征提取模块还用于采用所述自然语言处理算法对所述第一训练信息和所述第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料;该系统还包括:模型训练模块,用于采用决策树算法根据所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料进行模型训练,以得到文本识别模型;其中,所述文本识别模块还用于采用所述文本识别模型根据所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料得到头痛识别结果及相应的方案描述信息和方剂描述信息。3.如权利要求2所述的文本描述信息识别系统,其特征在于,该系统还包括归一化模块,用于:对所述头痛现象描述信息和所述头痛起因描述信息进行归一化,以得到归一化后的头痛现象描述信息和头痛起因描述信息,其中,所述特征提取模块还用于采用自然语言处理算法对归一化后的头痛现象描述信息和头痛起因描述信息分别提取关键特征分词和关键特征语料,以得到所述头痛现象描述信息和所述头痛起因描述信息的关键特征分词和关键特征语料;以及对所述第一训练信息和所述第二训练信息进行归一化,以得到归一化后的第一训练信息和第二训练信息,其中,所述特征提取模块还用于采用自然语言处理算法对归一化后的第一训练信息和第二训练信息分别提取关键特征分词和关键特征语料,以得到所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料。4.如权利要求2所述的文本描述信息识别系统,其特征在于,所述头痛现象描述信息和所述头痛训练现象信息包括头痛的发生位置、疼痛性质和发作形式;所述头痛起因描述信息和所述头痛起因训练信息包括外感和内伤;所述头痛识别结果和所述头痛训练结果包括风热头痛、风湿头痛、肝阳头痛和血虚头痛;所述方案描述信息和所述方案训练信息包括宜疏风清热和络、宜祛风胜湿通窍、宜平
肝潜阳息风和宜养血滋阴活络止痛;以及所述方剂描述信息和所述方剂训练信息包括芎芷石膏汤加减、羌活胜湿汤加减、天麻钩藤饮加减和加味四物汤加减。5.如权利要求3所述的文本描述信息识别系统,其特征在于,该系统还包括特征存储模块,用于:存储所述第一训练信息和所述第二训练信息的关键特征分词和关键特征语料,以形成信息库;以及存储所述第一训练信息和所述第二训...

【专利技术属性】
技术研发人员:苏亚玲李宗博杨婷婷
申请(专利权)人:吾征智能技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1