基于自然语言的企业决策要素提取方法及其系统技术方案

技术编号:16837379 阅读:22 留言:0更新日期:2017-12-19 19:54
本发明专利技术涉及基于自然语言的企业决策要素提取方法及其系统,该方法包括获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对企业动态信息进行清洗,获取分词;判断分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。本发明专利技术实现更进一步提取信息可能蕴含的对于使用者的决策要素,真正实现信息辅助决策,随着资讯样本量增加,词库和映射表会更加丰富和精确,并且结合对企业态势的感知,信息服务更加即时有效和具有针对性,有利于更好感知企业态势。

Extraction method and system of enterprise decision elements based on natural language

The present invention relates to the extraction method and system of enterprise decision-making factors based on natural language, the method includes obtaining enterprise public information; use of corporate public information to establish mapping relationship between events and decision factors, the formation of the sample information database; obtain dynamic information; cleaning, on the enterprise dynamic information acquisition and word segmentation; judging whether the event in the thesaurus the words are synonyms; if, according to the word extraction in the event of sample information library decision elements; if not, then the dynamic information forwarding and simple classification. The invention further extract information that may contain the decision factors for users, realize the information decision-making, information along with the increase of sample size, the lexicon and the mapping table will be more abundant and accurate, and according to the enterprise situation perception, information service is more effective and targeted, is conducive to a better perception of corporate situation.

【技术实现步骤摘要】
基于自然语言的企业决策要素提取方法及其系统
本专利技术涉及企业决策要素提取方法,更具体地说是指基于自然语言的企业决策要素提取方法及其系统。
技术介绍
提高决策水平是企业经营管理的关键,而要提高决策水平,就要寻找影响决策的要素,只有在影响决策的要素实现突破,才能从根本上提升企业的决策能力。产业决策的诱因是信息的输入,决策者通过各种渠道获得产业相关信息,而这些信息迎合或激发了决策者现实或潜在的投资需求,这时就激发了决策冲动。由此可以看出,产业决策的外部诱因是信息,内部动因是投资需求。对于上述提及的输入信息,现有的数据信息服务都是由信息直接提供的,或者对当前的信息进行简单分类后,进行信息服务,对于信息内容是否对使用者是否有用处或者影响都没有进行判断,也无法对信息内可能蕴含的企业经营决策要素进行提取,以至于无法依据该信息辅助使用者进行企业决策。中国专利201110236683.7公开了一种基于三元组的用户评论摘要的生成方法与系统,该方法包括如下步骤:建立对象的特征词库、映射词表与情感词库,并根据特征词库构建特征树;抓取用户评论网页;接收用户评论;对每一个用户评论逐一进行处理,生成各自基于评论三元组的评论摘要;归纳整合所有用户评论的评论三元组,生成决策三元组;计算特征和情感词极性相同的决策三元组的数量;抽取所有的决策三元组生成决策摘要。利用本方法或系统,为每个用户评论生成评论摘要,以便于用户查看参考,并且将所有的评论三元组归纳整合,生成具有指导意义的决策三元组,并抽取全部决策三元组生成能反映总体评价结果、具有决策辅助作用的决策摘要,从而辅助用户快速地做出正确决策。上述的专利无法实时更新对象的特征词库、映射词表与情感词库,容易导致用户做出的决策准确度不高。因此,有必要设计一种基于自然语言的企业决策要素提取方法,实现更进一步提取信息可能蕴含的对于使用者的决策要素,真正实现信息辅助决策,随着资讯样本量增加,词库和映射表会更加丰富和精确,并且结合对企业态势的感知,信息服务更加即时有效和具有针对性,有利于更好感知企业态势。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供基于自然语言的企业决策要素提取方法及其系统。为实现上述目的,本专利技术采用以下技术方案:基于自然语言的企业决策要素提取方法,所述方法包括:获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对所述企业动态信息进行清洗,获取分词;判断所述分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。其进一步技术方案为:利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤,包括以下具体步骤:提取企业公开资讯中的实体、事件、关键词、决策要素以及事件与决策要素的映射关系;保存所述资讯原文、摘要、实体、事件、关键字以及事件与决策要素的映射关系,形成样本资讯库。其进一步技术方案为:获取企业公开资讯的步骤之前,还包括:建立事件词库以及实体词库。其进一步技术方案为:利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤之后,还包括:将事件词库中的词根据自然语义进行同义词合并;将实体词库中的词根据自然语义进行同义词合并。其进一步技术方案为:对所述企业动态信息进行清洗,获取分词的步骤,包括以下具体步骤:对所述企业动态信息的文本内容进行分段处理以及分句处理,获取每段文本以及每句文本;对每段文本以及每句文本进行分词处理,获取每段以及每句中的分词。其进一步技术方案为:判断所述分词是否与事件词库中的词同义的步骤之后,还包括:判断事件词库或样本资讯库是否能覆盖动态信息;若能,则进入结束步骤;若不能,则采用机器学习方式扩充现有的事件词库和样本资讯库。本专利技术还提供了基于自然语言的企业决策要素提取系统,包括资讯获取单元、样本资讯库形成单元、动态信息获取单元、分词获取单元、判断单元、提取决策要素以及简单处理单元;所述资讯获取单元,用于获取企业公开资讯;所述样本资讯库形成单元,用于利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;所述动态信息获取单元,用于获取企业动态信息;所述分词获取单元,用于对所述企业动态信息进行清洗,获取分词;所述判断单元,用于判断所述分词是否与事件词库中的词同义;所述提取决策要素,用于若是,则根据分词在事件样本资讯库中提取决策要素;所述简单处理单元,用于若否,则进行动态信息转发和简单分类。其进一步技术方案为:所述样本资讯库形成单元包括提取模块以及保存模块;所述提取模块,用于提取企业公开资讯中的实体、事件、关键词、决策要素以及事件与决策要素的映射关系;所述保存模块,用于保存所述资讯原文、摘要、实体、事件、关键字以及事件与决策要素的映射关系,形成样本资讯库。其进一步技术方案为:所述系统还包括词库建立单元;所述词库建立单元,用于建立事件词库以及实体词库。其进一步技术方案为:所述系统还包括第一合并单元以及第二合并单元;所述第一合并单元,用于将事件词库中的词根据自然语义进行同义词合并;所述第二合并单元,用于将实体词库中的词根据自然语义进行同义词合并。本专利技术与现有技术相比的有益效果是:本专利技术的基于自然语言的企业决策要素提取方法,通过获取企业公开资讯,利用资讯中筛选出来的事件建立其与决策要素的映射关系表,在获取到企业动态信息后,对动态信息进行清洗,获取分词,根据分词与事件词库中的词对比,若同义,则根据分词在事件样本资讯库中提取决策要素,实现更进一步提取信息可能蕴含的对于使用者的决策要素,真正实现信息辅助决策,随着资讯样本量增加,词库和映射表会更加丰富和精确,并且结合对企业态势的感知,信息服务更加即时有效和具有针对性,有利于更好感知企业态势。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明图1为本专利技术具体实施例提供的基于自然语言的企业决策要素提取方法的流程图;图2为本专利技术具体实施例提供的形成事件样本资讯库的流程图;图3为本专利技术具体实施例提供的对所述企业动态信息进行清洗并获取分词的流程图;图4为本专利技术具体实施例提供的基于自然语言的企业决策要素提取系统的结构框图;图5为本专利技术具体实施例提供的样本资讯库形成单元的结构框图;图6为本专利技术具体实施例提供的分词获取单元的结构框图。具体实施方式为了更充分理解本专利技术的
技术实现思路
,下面结合具体实施例对本专利技术的技术方案进一步介绍和说明,但不局限于此。如图1~6所示的具体实施例,本实施例提供的基于自然语言的企业决策要素提取方法,可以运用在对互联网上的海量企业信息的分类过程中,实现更进一步提取信息可能蕴含的对于使用者的决策要素,真正实现信息辅助决策,随着资讯样本量增加,词库和映射表会更加丰富和精确,并且结合对企业态势的感知,信息服务更加即时有效和具有针对性,有利于更好感知企业态势。如图1所示,本实施例提供的基于自然语言的企业决策要素提取方法,该方法包括:S1、获取企业公开资讯;S2、利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;S3、获取企业动态信息;S4、对所述企业动态信息进行清洗,获取分词;S5、判断所述分词是否与事件词库中的词同义;S6、若是,则根据分词在事件样本资讯库中提取决策要素;S7、若本文档来自技高网
...
基于自然语言的企业决策要素提取方法及其系统

【技术保护点】
基于自然语言的企业决策要素提取方法,其特征在于,所述方法包括:获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对所述企业动态信息进行清洗,获取分词;判断所述分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。

【技术特征摘要】
1.基于自然语言的企业决策要素提取方法,其特征在于,所述方法包括:获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对所述企业动态信息进行清洗,获取分词;判断所述分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。2.根据权利要求1所述的基于自然语言的企业决策要素提取方法,其特征在于,利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤,包括以下具体步骤:提取企业公开资讯中的实体、事件、关键词、决策要素以及事件与决策要素的映射关系;保存所述资讯原文、摘要、实体、事件、关键字以及事件与决策要素的映射关系,形成样本资讯库。3.根据权利要求1或2所述的基于自然语言的企业决策要素提取方法,其特征在于,获取企业公开资讯的步骤之前,还包括:建立事件词库以及实体词库。4.根据权利要求3所述的基于自然语言的企业决策要素提取方法,其特征在于,利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤之后,还包括:将事件词库中的词根据自然语义进行同义词合并;将实体词库中的词根据自然语义进行同义词合并。5.根据权利要求4所述的基于自然语言的企业决策要素提取方法,其特征在于,对所述企业动态信息进行清洗,获取分词的步骤,包括以下具体步骤:对所述企业动态信息的文本内容进行分段处理以及分句处理,获取每段文本以及每句文本;对每段文本以及每句文本进行分词处理,获取每段以及每句中的分词。6.根据权利要求5所述的基于自然语言的企业决策要素提取方法,其特征在于,判断所述分词是否与事件词库中的词同义的步骤之后,还包括:...

【专利技术属性】
技术研发人员:宋小鹏田丁丁
申请(专利权)人:前海梧桐深圳数据有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1