一种面向流程的领域知识抽取与推送方法技术

技术编号:13383465 阅读:51 留言:0更新日期:2016-07-21 17:41
一种面向流程的领域知识抽取与推送方法,其方法在于:从知识资源中抽取知识并用知识向量表示,从流程任务中提取流程向量,从用户描述中提取用户属性向量;通过在流程向量、用户属性向量和知识向量之间进行匹配计算,得出知识需求和知识的相关度;通过用户行为变量计算得到知识分值,最终用知识分值对知识相关度计算的结果进行校正,得到与流程任务密切相关的知识排序结果,实现知识向流程任务的更准确推送。本发明专利技术认为知识推送的本质是在正确的时间,以正确的形式,把正确的知识传给正确的人,本发明专利技术提供的面向流程的领域知识抽取与推送系统及方法工作效率高、准确性好。

【技术实现步骤摘要】
一种面向流程的领域知识抽取与推送方法
本专利技术涉及一种计算机知识应用系统,特别是用于抽取与用户业务活动相关的知识,并按实际需要智能地推送知识到相关业务活动的方法和系统。
技术介绍
知识经济环境下,知识正成为越来越多企业的最重要资源,其实质是将知识视为最重要的企业资源,通过知识的获取和共享,将恰当的知识传递给恰当的使用者,从而有效地提高企业知识利用率、促进员工的知识创新,使企业获得竞争优势。知识管理和集成是提高企业知识重用水平,防止知识流失,实现业务流程自动化、智能化的有效手段。企业在生产过程中积累了大量的经验和知识,但是这些知识大多以数据库、知识库、纸质文件和人脑中隐性知识的形式存在,人们获取知识的方式主要通过手工检索,无法保证知识获取的及时性、准确性和全面性。所以研究将已有知识与产品设计活动相关联,与设计过程进行集成,使得研发设计过程的参与人员在恰当的时间获得需要的知识显得很有必要。研发设计过程是知识密集的活动集合,一方面设计活动应用大量的规则知识、实例知识、经验数据进行决策和指导设计;另一方面设计活动也是知识产生和获取的源泉。知识集成的目标就是将设计知识管理与设计过程结合,通过对设计活动角色、对象、目标、需求等属性的描述,与相关知识进行匹配,从而减少手工知识搜索工作,实现快速准确地将设计知识推送给设计人员。目前国内外已经有些学者和组织对企业知识推送进行了研究和尝试。在基于流程和事件驱动的知识推送系统研究方面,主要著述有:在文献:王生发,顾新建,郭剑锋等所撰论文:面向产品设计的知识主动推送研究,载于《计算机集成制造系统》,2007,13(2):234-239,针对现有系统不能主动将知识在适当的时候传递给适当的设计人员的缺点,提出了一种基于知识管理的、以工作流驱动的产品设计知识主动推送体系结构和方式;但其知识匹配体系所涉及的规则和对象比较多,从而影响了知识匹配和推送的效率和正确率;在文献:刘新宇撰论文:基于流程的知识推送系统的理论框架与应用研究。沈阳:东北大学,2005。对基于流程的知识推送系统主要对其理论、框架与应用进行了系统研究;对知识推送技术,主要介绍了面向岗位的运营知识和面向员工的项目知识的推送方法;但仍没有考虑知识领域的影响,其方法存在检索数据量大、推送精度不高的问题;在文献:陈浩,刘念,胡艳军撰论文:基于工作流的知识建模研究,载于《制造业自动化》,2005,27(5):8-12,提出了基于工作流的知识建模及其系统框架,讨论了支持知识与知识、知识与人、以及知识与过程的集成技术,以及将知识应用到企业的业务流程中的方法;但该文只考虑了工作流和知识库的相互作用,没有考虑知识主体——人在其中的影响,且只是建立了概念模型和简单介绍了相关技术。上述研究的共同缺点是提出的知识匹配与推送方法存在效率低、准确性差等问题。
技术实现思路
本专利技术的目的是:针对上述
技术介绍
存在的问题而提出的一种新的面向流程的领域知识抽取与推送系统及方法。本专利技术认为知识推送的本质是在正确的时间,以正确的形式,把正确的知识传给正确的人。只有把知识、企业业务流程和人三者结合起来,才能实现有效的知识推送。本专利技术的技术方案是:一种面向流程的领域知识抽取与推送系统,包括如下模块:用户模块,用户是知识推送的目标,用户参考系统推送的知识执行流程任务,并进行其他知识管理活动;知识资源模块,为企业知识提供一个存储空间,并对其进行分类管理,响应知识推送请求,辅助用户模块的员工完成流程任务;知识推送模块,由知识表示抽取层和知识计算重构层构成,用于缩小知识匹配范围,只匹配符合流程特性的领域知识,并推送给用户,提高匹配效率和精度;流程模块,是知识推送的源头,流程由企业的具体需求产生,可以划分成几个相对独立的子流程任务,各个子流程可以根据其涉及的相关知识来设置知识的属性。所述用户模块进行的其他知识管理活动包括对推送的知识进行评价和反馈、发布自己的隐性知识、定制感兴趣的知识、向其他用户推荐知识等。所述知识资源模块是由企业知识库、企业员工隐性知识、客户知识、企业外部公开网络等方面的知识构成的一个知识空间。所述知识推送模块由知识表示抽取层和知识计算重构层构成。所述知识表示抽取层包括知识抽取层和知识表示层。所述知识抽取层是指采用文本信息提取技术从企业内众多的知识资源中提取出所需的知识内容。所述文本信息提取技术是指从一段文本中提取出规定的某一类或几类特定信息,并将其进行结构化处理的过程;其处理过程包括,首先构造信息提取的规则集,再利用这些规则从文本中提取出指定的信息。所述知识表示层是将文本信息提取的结果以数据库的数据表等形式进行信息规范化,知识表示层与知识向量对应。所述知识计算重构层是指在知识表示的基础上,根据流程任务对知识的需求,通过对知识的匹配运算,得到符合条件的知识,并将所得到的知识推送给执行流程任务的用户。所述知识的匹配运算包括如下步骤:第一,相关性计算,是指根据业务流程对知识的需求(即流程向量),以及知识自身的特征(即知识向量)和用户的专业、偏好及经验(即用户属性向量),对符合知识需求的知识进行相关性计算;第二,知识分值计算是指基于用户行为向量产生的对知识的评分计算;第三,知识排序是指在相关性计算的基础上,知识分值计算结果干预相关性计算对知识的排序,得到校正后的知识得分,按照得分从高到低的顺序对知识进行排序,将结果推送给完成某一特定任务的用户,从而实现本专利技术所述的与流程任务具有紧密联系的知识的推送。一种面向流程的领域知识抽取与推送方法,其特征在于,包括如下步骤:第一,从知识资源中抽取知识并用知识向量表示,从流程任务中提取流程向量,从用户描述中提取用户属性向量;第二,通过在流程向量、用户属性向量和知识向量之间进行匹配计算,得出知识需求和知识的相关度;第三,通过用户行为变量计算得到知识分值,最终用知识分值对知识相关度计算的结果进行校正,得到与流程任务密切相关的知识排序结果,实现知识向流程任务的更准确推送。所述从知识资源中抽取知识是指采用文本信息提取技术从企业内众多的知识资源中提取出所需的知识内容;所述文本信息提取技术是指从一段文本中提取出规定的某一类或几类特定信息,并将其进行结构化处理的过程。所述知识向量是用来描述知识的向量空间。所述知识向量(KNOWLEDGEVECTORS,WV)的来源包括文本的主题、作者、关键词、摘要和时间;所述知识向量是一个五元组:KV=SF,AF,KF,ABF,TIF其中:SF为主题因子(TOPICFACTORS),SF={sfi:I=1,2,...,|SF|},表示文本的所属主题,由有限个数的主题词汇表示,同一篇文档可以归属于一个或多个主题;AF为作者因子(AUTHORFACTORS),AF={AFJ:J=1,2,...,|AF|},表示知识的作者;KF为关键词因子(KEYWORDFACTORS),KF={KFK:K=1,2,...,|KF|},表示文本的关键词;ABF为摘要因子(ABSTRACTFACTORS),ABF={ABFM:M=1,2,...,|ABF|},由有限个数的来自文本摘要的词汇来表示;TIF为时间因子(TIMEFACTORS),由YY-MM-DD六位编码表示,分别代表文档产生的年、月和日。所述流程向量来自流程本文档来自技高网
...

【技术保护点】
一种面向流程的领域知识抽取与推送方法,其特征在于,包括如下步骤:第一,从知识资源中抽取知识并用知识向量表示,从流程任务中提取流程向量,从用户描述中提取用户属性向量;第二,通过在流程向量、用户属性向量和知识向量之间进行匹配计算,得出知识需求和知识的相关度;第三,通过用户行为变量计算得到知识分值,最终用知识分值对知识相关度计算的结果进行校正,得到与流程任务密切相关的知识排序结果,实现知识向流程任务的更准确推送。

【技术特征摘要】
1.一种面向流程的领域知识抽取与推送方法,其特征在于,包括如下步骤:第一,从知识资源中抽取知识并用知识向量表示,从流程任务中提取流程向量,从用户描述中提取用户属性向量;第二,通过在流程向量、用户属性向量和知识向量之间进行匹配计算,得出知识需求和知识的相关度,其中,所述知识需求KR由流程向量WV、用户属性向量UV构成的向量集合所表征,KR=WV∪UV,所述知识为由文本的主题、作者、关键词、摘要和时间构成的五元组知识向量KV,所述知识需求和知识的相关度表示为:其中,W1k、W2k分别表示知识需求KR和知识向量KV第K个特征项的权值,1<=k<=N,其中,知识需求或知识的集合中不存在的特征项,该特征项在相应集合中的权值为0;第三,通过用户行为变量计算得到知识分值,最终用知识分值对知识相关度计算的结果进行校正,得到与流程任务密切相关的知识排序结果,实现知识向流程任务的更准确推送。2.根据权利要求1所述的面向流程的领域知识抽取与推送方法,其特征在于,所述从知识资源中抽取知识是指采用文本信息提取技术从企业内众多的知识资源中提取出所需的知识内容;所述文本信息提取技术是指从一段文本中提取出规定的某一类或几类特定信息,并将其进行结构化处理的过程。3.根据权利要求1所述的面向流程的领域知识抽取与推送方法,其特征在于,所述知识向量是用来描述知识的向量空间。4.根据权利要求1所述的面向流程的领域知识抽取与推送方法,其特征在于,所述知识向量(KnowledgeVectors,WV)的来源包括文本的主题、作者、关键词、摘要和时间;所述知识向量是一个五元组:KV=SF,AF,KF,ABF,TIF其中:SF为主题因子(TopicFactors),SF={sfi:i=1,2,…,|SF|},表示文本的所属主题,由有限个数的主题词汇表示,同一篇文档可以归属于一个或多个主题;AF为作者因子(AuthorFactors),AF={afj:j=1,2,…,|AF|},表示知识的作者;KF为关键词因子(KeywordFactors),KF={kfk:k=1,2,…,|KF|},表示文本的关键词;ABF为摘要因子(AbstractFactors),ABF={abfm:m=1,2,…,|ABF|},由有限个数的来自文本摘要的词汇来表示;TIF为时间因子(TimeFactors),由YY-MM-DD六位编码表示,分别代表文档产生的年、月和日。5.根据权利要求1所述的面向流程的领域知识抽取与推送方法,其特征在于,所述流程向量来自流程任务,流程向量(WorkflowVectors,WV)是一个三元组:WV=FF,WTF,WPF其中:FF为领域因子(FieldFactors),FF={ffi:i=1,2,…,|FF|},表示业务领域的有限集;WTF为流程类型因子(WorkflowTypeFactors),WTF={wtfj:j=1,2,…,|WTF|},表示在业务流程实例运行阶段,根据具体的实例任务和情境所提出的流程类型有限集;WPF为工作...

【专利技术属性】
技术研发人员:赵民王永庆施荣明沈琪张静张国明田锋黄毓瑜高建忠赵琦
申请(专利权)人:中国航空工业集团公司沈阳飞机设计研究所
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1