一种基于相关性知识特征提取的方法技术

技术编号:10584630 阅读:161 留言:0更新日期:2014-10-29 14:18
本发明专利技术涉及一种基于相关性知识特征提取的方法,属于工业工程领域。本发明专利技术首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。本发明专利技术通过关键词的概括与提取,可以更好地针对信息源作出判断;通过采用AHP“1~9”评分法提高了信息整合的精确性,对相互关系强烈的关键词进行合并,生成新的信息关键词,提高了信息整合的有效性。

【技术实现步骤摘要】
一种基于相关性知识特征提取的方法
本专利技术涉及一种基于相关性知识特征提取的方法,属于工业工程领域。
技术介绍
随着社会的发展与进步,我们已经进入到一个信息大爆炸的时代,在多元、大量复杂的信息中提取有用的相关信息,是一个难点,也是一个重点。21世纪企业的成功越来越依赖于企业所拥有知识的质量,利用企业所拥有的知识为企业创造竞争优势和持续竞争优势对企业来说始终是一个挑战。知识来源越多,对我们利用知识的特征来进行知识的整合就越来越难,这是当前人们所研究的热点。如何快速精确地定位相关有用信息的特征,并整合相关知识,在这一问题中:①没有针对相关知识系统进行相关知识特征整合的方法设计;②没有采用AHP法中的“1~9”评分原理进行知识特征聚类的规则设计;③没有采用降维的思想对知识信息结构体进行设计;④没有设计过特征值相互关系表。针对上述问题,本专利技术一种相关性知识特征提取的方法,该方法采用降维的思想,针对相关知识结构体中复杂、多元的信息进行了提取关键知识特征的方法设计。该方法通过设计特征值相互关系表以及基于AHP法中“1~9”的评分规则设计,为相关知识特征提取提供了一个有效的方法。
技术实现思路
本专利技术提供了一种基于相关性知识特征提取的方法,以用于解决如何快速准确的从相互独立的复杂信息中,提取并整合关键性的知识信息。本专利技术的技术方案是:一种基于相关性知识特征提取的方法,首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。所述方法的具体步骤如下:Step1、针对一组信息中的n个信息源分别通过信息筛选与压缩的方式得到每个信息源相对应的关键词;Step2、利用信息源所对应的关键词组成n行n列两两对应的关键词相互关系;接着采用AHP法中的“1~9”评分标准对两两对应的关键词相互关系进行两两比较评分,得到n×n个关键词相互关系强烈度;根据n×n个关键词相互关系强烈度构建n行n列的关键词相互关系表;Step3、相关性的检验:采用AHP法中的“1~9”评分标准进行关键词相互关系评分后,对关键词相互关系进行相关性的检验:如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数不存在相同的情况,则不需重新进行打分比较;如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数存在相同的情况,则需重新进行打分比较;Step4、依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;Step5、通过步骤Step4中找到的自身最相关的关键词的两两结合,形成新的信息源;Step6、针对步骤Step5中形成的新信息源重复执行步骤Step1~步骤Step5,直到关键词合并成统一的关键词为止。所述相互关系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强,系数越小为相互关系强烈度越弱。所述步骤Step3中重新进行打分比较为根据需要确定评分中所有要保留的小数点后的位数。所述统一的关键词为一组信息的关键知识点。本专利技术的有益效果是:该方法在实际应用背景中具有较好的环境适应性;通过关键词的概括与提取,可以更好地针对信息源作出判断,通过设计关键词相互关系表,并采用AHP“1~9”评分法提高了信息整合的精确性,对相互关系强烈的关键词进行合并,生成新的信息关键词,提高了信息整合的有效性。附图说明图1为本专利技术的算法流程图。具体实施方式实施例1:如图1所示,一种基于相关性知识特征提取的方法,首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。所述方法的具体步骤如下:Step1、针对一组信息中的n个信息源分别通过信息筛选与压缩的方式得到每个信息源相对应的关键词;Step2、利用信息源所对应的关键词组成n行n列两两对应的关键词相互关系;接着采用AHP法中的“1~9”评分标准对两两对应的关键词相互关系进行两两比较评分,得到n×n个关键词相互关系强烈度;根据n×n个关键词相互关系强烈度构建n行n列的关键词相互关系表;Step3、相关性的检验:采用AHP法中的“1~9”评分标准进行关键词相互关系评分后,对关键词相互关系进行相关性的检验:如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数不存在相同的情况,则不需重新进行打分比较;如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数存在相同的情况,则需重新进行打分比较;Step4、依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;Step5、通过步骤Step4中找到的自身最相关的关键词的两两结合,形成新的信息源;Step6、针对步骤Step5中形成的新信息源重复执行步骤Step1~步骤Step5,直到关键词合并成统一的关键词为止。所述相互关系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强,系数越小为相互关系强烈度越弱。所述步骤Step3中重新进行打分比较为根据需要将关键词相互关系表中数据的每一行、每一列的分数存在相同情况的数据重新确定其相同评分中所有要保留的小数点后的位数。所述统一的关键词为一组信息的关键知识点。实施例2:如图1所示,一种基于相关性知识特征提取的方法,首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。所述方法的具体步骤如下:现有6条相关性知识的信息,利用本专利技术所述的相关知识特征提取的方法对这6条相关性知识的信息进行特征关系的提取与合并,该6条信息如下:信息1:线性表是一种线性结构,它的特点是数据元素之间是一种线性关系,即数据元素一个接一个的排列;信息2:栈是一种限制在表的一端进行插入和删除的结构体,允许插入、删除的这一端称为栈顶,另一个固定端称为栈底;信息3:二叉树是树形结构的另一个重要类型,许多实际问题抽象出来的数据结构往往是二叉树的形式;信息4:图形结构是一种比树形结构更为复杂的非线性结构,被用来描述各种复杂的数据结构,在实际生活中应用广泛;信息5:顺序存储结构的主要优点是节省存储空间,因为分配给数据的存储单元全用存放结点的数据(不考虑C/C++语言中数组需指定大小的情况),结点之间的逻辑关系没有占用额外的存储空间;信息6:链式存储又叫链接存储结构,在计算本文档来自技高网...
一种基于相关性知识特征提取的方法

【技术保护点】
一种基于相关性知识特征提取的方法,其特征在于:首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。

【技术特征摘要】
1.一种基于相关性知识特征提取的方法,其特征在于:首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止;所述方法的具体步骤如下:Step1、针对一组信息中的n个信息源分别通过信息筛选与压缩的方式得到每个信息源相对应的关键词;Step2、利用信息源所对应的关键词组成n行n列两两对应的关键词相互关系;接着采用AHP法中的“1~9”评分标准对两两对应的关键词相互关系进行两两比较评分,得到n×n个关键词相互关系强烈度;根据n×n个关键词相互关系强烈度构建n行n列的关键词相互关系表;Step3、相关性的检验:采用AHP法中的“1~9”评分标准进行关键词相互关系评分后,对关键词相互关系进行相关性的检验:如果关键词相互关系构成的关键词相互关系表中每一行中的分数不存在相同的情况且每一列中的分数不存在相同的情况,则不需重新...

【专利技术属性】
技术研发人员:侯开虎朱栩颖杨维平陈婷钟昕怡
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1