当前位置: 首页 > 专利查询>华斌专利>正文

基于知识融合的政务信息化项目多专家意见机器整合方法技术

技术编号:29675147 阅读:34 留言:0更新日期:2021-08-13 21:57
同行专家评审是各个专业领域普遍采用的一种项目评价模式,同一个项目参评的多个专家在评审中会根据自己的观点对相关指标打分,并随后附注相关的文字意见。人工整合的专家组意见在一定程度上受人的多因素影响,且时效性低、复核工作量大,难以适应多项目网评的工作模式。本成果提出基于知识融合、以认知层的知识处理支撑文本层的意见整合,有效提升人工整合的效率与知识覆盖程度。在创建领域知识概念树与项目知识本体的知识补充与知识表示方法支撑下,通过SAO结构化知识获取与自定义的非结构化知识获取方法得到专家意见知识,在项目知识本体基础上完成知识关联、知识融合,完整实现多专家评审意见的专家组意见机器整合。

【技术实现步骤摘要】
基于知识融合的政务信息化项目多专家意见机器整合方法1、
计算机科学与技术(人工智能、知识工程)、项目管理、知识管理(电子政务)、情报学、文本处理技术2、
技术介绍
(1)项目管理电子政务项目管理的相关标准与规定的整理;项目管理流程与项目评价指标的解读;专家意见短文本分析与专家组意见的模板整理等。(2)知识管理技术①建立项目知识概念树:项目知识概念树实际上是一种针对评审目标的、具有标准概念的分层知识表示方法。项目知识概念树的作用在这里是支持对专家评审意见实体进行分层语义识别,可以支持对专家意见文本进行结构化处理后的依存句法分析,实现基于概念树的语义映射,从而实现对专家意见文本中的实体进行不同概念层次的语义识别。②建立政务信息化项目审批知识本体:政务信息化项目知识本体可以比较完整地表示项目背景知识,也是知识融合的语义规范,支持本成果中的知识融合技术实现。政务信息化项目审批知识本体的概念与概念间的关系来自于政务信息化项目管理的相关标准与规定。③意见挖掘技术:意见挖掘是专家意见文本中知识获取的有效手段。短文本意见挖掘的难点在于短文本中对意见元素的表达具有形式多样或非显式的方式,在中文语境中则更加难以理解。自动化的短文本理解需要依赖额外的知识,这些知识可以帮助机器充分挖掘短文本中词与词之间的联系,如语义相关性。④知识融合技术:从知识管理视角看,专家意见是一个以项目知识为基础的知识源,而专家组综合意见形成就是以项目知识为背景的多源知识融合问题。知识融合可以对多源异构数据进行实时、准确、智能的分析和提取,经过针对应用目标的科学计算实现知识单元的揭示、共享、关联和发现,进而得到融合后的新知识或新的解决方案。(3)文本处理技术①常规文本处理技术:包括项目评价指标打分表的整理,利用政务信息化项目的标准与管理规范训练项目的概念词库,辅之以同义词、近义词构成的基础词库。利用开源工具Hanlp对专家意见文本进行分句、分词、词性标注、去除无意义的停用词,利用依存句法分析识别语句SAO(主谓宾)结构,进行多主语或多宾语的意见句拆分,将包含多评价对象的复杂句细化为多个只包含唯一评价对象的SAO结构简单句等。②基于知识融合的文本整合技术:基于信息融合的文本整合方法由于缺乏领域知识规范,必然具有知识增益的不确定性特点。在项目知识边界清晰、知识表达规范的基础上,知识融合方法可以实现以认知层的知识融合结果支撑文本整合的表达,较基于信息融合的方法不仅从扩充知识获取空间角度具有更好的知识增益,而且在针对性与深刻性的语义整合结果上会有更好的效果。(4)情感分析技术利用深度学习模型对专家意见语句进行情感倾向判定,利用RNN、LSTM、BIRNN、BILSTM四种分类器进行情感分类对比,得到最优的语义确定、情感倾向确定的意见集。3、
技术实现思路
本成果采用分层语义识别方法获取个体专家意见中的基本知识元,利用领域知识本体进行语义规范并实现知识扩充,进一步以知识融合支撑专家意见整合的技术方法实现专家组意见的生成。成果的实现过程包含如下主要处理环节,分别描述如下:(1)知识补充与知识表示为解决微观层的知识获取与定位问题,引入项目知识概念树层次化地表达项目概念知识与概念间的语义层次;在宏观层引入领域知识本体表示项目知识,支持知识扩充与关联、知识变换以实现隐性知识发现;从而完成多源知识融合为基础的综合意见生成。构成概念树与本体的知识均来自国家标准及对政务信息化项目的相关管理政策。(2)基于分层语义识别的知识获取专家意见知识获取旨在获取专家对项目要素的调整建议及情感态度等知识,为知识融合提供基础。该策略分别在词汇层(分词和词性标注)、句法层(命名实体识别和语法分析)、语义层(语义识别)进行知识挖掘与获取。由于专家意见中的实体包含丰富的概念语义,利用命名实体识别技术进行实体语义识别,能够在没有领域词典的情况下提供特定领域的实体词库。针对评价意见的短文本特征,在语法分析基础上对专家意见进行SAO(subject-action-object)提取以实现结构化知识的获取,再以概念树支撑分层语义识别,挖掘出专家意见评价特征,利用深度学习模型构建情感分类器获得情感极性。该部分具体包括如下内容:①命名实体识别通过投票法集成HMM、CRF、BILSTM、BILSTM-CRF四种命名实体识别方法在政务职能实体抽取中得到较好的结果。在此以专家评价意见文本为数据,首先利用开源工具Hanlp对专家意见文本初步分句、分词、词性标注、去除停用词,然后将其分词特征Xi、词性特性POSi融入命名实体标注以提高集成模型效果。在抽取的同时形成领域实体词库。②内在语义分析与结构化知识获取通过依存句法分析可以获得句子中的依存语法,揭示语句内各词语的语义依赖关系。SAO是一种从文本语料中抽取的三元组结构,在包含大量信息的同时,还可以有效地保持信息之间的内在关联性。利用依存句法分析,对多主语或多宾语并列的意见句进行拆分,抽取到细粒度的SAO结构化知识,将其作为基础语义单元来表示专家意见,主语S和宾语O主要表示被评价对象,一般为名词、动名词等,这些词或词组所组成的主语或宾语与项目概念语义紧密相关。③评价特征分层语义识别SAO结构化后的评价意见需要针对主语和宾语进行评价特征分层语义识别,得到针对性强的细粒度评价特征。由于不同专家在概念表达上存在差异,采用精准匹配和基于文本最大相似度的模糊匹配方法综合实现基于概念树的概念语义映射,以得到较好的分层语义识别效果,其方法如下:1)精准匹配方法对于SAO结构文本SAOi,将其主语Si和宾语Oi分别与概念树概念集合C中的概念cj进行双向最大匹配,并将二者匹配成功的概念集合取并集得到集合Ri。若Ri不为空,比较Ri中的每个概念的层次深度,取最大深度的概念为该句的语义识别结果;若Ri为空,则进行模糊匹配。2)模糊匹配方法在意见文本结构化形成过程中,为不破坏专家意见完整性,保留形容词、副词、介词、连词等修饰性词语。但在利用文本相似度计算的模糊匹配中,必须利用分词并通过词性筛选去除修饰性词语以提高准确性,保留主要词语集合Si’={si1,si2,...,sim}和Oi’={oi1,oi2,...,oin}(m、n为词语个数)。因此,将概念集合C中的概念cj进行分词得到cj={cj1,cj2,...,cjt}(t为词语个数)。基于细粒度分词的相似度Sim(Si’,cj)、Sim(Oi’,cj)的计算过程如公式(1)(2)所示。其中sim(sik,cjr)为word2vec词向量余弦相似度计算。通过细粒度分词,采用笛卡尔积形式求平均相似度得到的结果准确性更高。循环概念集合C,计算Sim(Si’,cj)、Sim(Oi’,cj),取大于阈值的最大相似度,其对应的概念为该SAOi识别到的概念语义。④非结构化知识获取定义由于短文本中存在语言书写的不规范问题本文档来自技高网
...

【技术保护点】
1.一种应用于电子政务领域专家组评审意见整合的机器自动整合方法,其特征在于,包括:S1、利用领域概念树与领域知识本体的知识表达方式进行知识抽取、关联与语义识别,挖掘基于被评价项目背景的隐性知识;S2、在微观层与宏观层进行基于知识融合的电子政务领域专家组意见整合。/n

【技术特征摘要】
1.一种应用于电子政务领域专家组评审意见整合的机器自动整合方法,其特征在于,包括:S1、利用领域概念树与领域知识本体的知识表达方式进行知识抽取、关联与语义识别,挖掘基于被评价项目背景的隐性知识;S2、在微观层与宏观层进行基于知识融合的电子政务领域专家组意见整合。


2...

【专利技术属性】
技术研发人员:华斌吴诺贺欣
申请(专利权)人:华斌吴诺贺欣
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1