The present invention relates to the extraction method and system of enterprise decision-making factors based on natural language, the method includes obtaining enterprise public information; use of corporate public information to establish mapping relationship between events and decision factors, the formation of the sample information database; obtain dynamic information; cleaning, on the enterprise dynamic information acquisition and word segmentation; judging whether the event in the thesaurus the words are synonyms; if, according to the word extraction in the event of sample information library decision elements; if not, then the dynamic information forwarding and simple classification. The invention further extract information that may contain the decision factors for users, realize the information decision-making, information along with the increase of sample size, the lexicon and the mapping table will be more abundant and accurate, and according to the enterprise situation perception, information service is more effective and targeted, is conducive to a better perception of corporate situation.
【技术实现步骤摘要】
基于自然语言的企业决策要素提取方法及其系统
本专利技术涉及企业决策要素提取方法,更具体地说是指基于自然语言的企业决策要素提取方法及其系统。
技术介绍
提高决策水平是企业经营管理的关键,而要提高决策水平,就要寻找影响决策的要素,只有在影响决策的要素实现突破,才能从根本上提升企业的决策能力。产业决策的诱因是信息的输入,决策者通过各种渠道获得产业相关信息,而这些信息迎合或激发了决策者现实或潜在的投资需求,这时就激发了决策冲动。由此可以看出,产业决策的外部诱因是信息,内部动因是投资需求。对于上述提及的输入信息,现有的数据信息服务都是由信息直接提供的,或者对当前的信息进行简单分类后,进行信息服务,对于信息内容是否对使用者是否有用处或者影响都没有进行判断,也无法对信息内可能蕴含的企业经营决策要素进行提取,以至于无法依据该信息辅助使用者进行企业决策。中国专利201110236683.7公开了一种基于三元组的用户评论摘要的生成方法与系统,该方法包括如下步骤:建立对象的特征词库、映射词表与情感词库,并根据特征词库构建特征树;抓取用户评论网页;接收用户评论;对每一个用户评论逐一进行处理,生成各自基于评论三元组的评论摘要;归纳整合所有用户评论的评论三元组,生成决策三元组;计算特征和情感词极性相同的决策三元组的数量;抽取所有的决策三元组生成决策摘要。利用本方法或系统,为每个用户评论生成评论摘要,以便于用户查看参考,并且将所有的评论三元组归纳整合,生成具有指导意义的决策三元组,并抽取全部决策三元组生成能反映总体评价结果、具有决策辅助作用的决策摘要,从而辅助用户快速地做出正确决策。上 ...
【技术保护点】
基于自然语言的企业决策要素提取方法,其特征在于,所述方法包括:获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对所述企业动态信息进行清洗,获取分词;判断所述分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。
【技术特征摘要】
1.基于自然语言的企业决策要素提取方法,其特征在于,所述方法包括:获取企业公开资讯;利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;获取企业动态信息;对所述企业动态信息进行清洗,获取分词;判断所述分词是否与事件词库中的词同义;若是,则根据分词在事件样本资讯库中提取决策要素;若否,则进行动态信息转发和简单分类。2.根据权利要求1所述的基于自然语言的企业决策要素提取方法,其特征在于,利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤,包括以下具体步骤:提取企业公开资讯中的实体、事件、关键词、决策要素以及事件与决策要素的映射关系;保存所述资讯原文、摘要、实体、事件、关键字以及事件与决策要素的映射关系,形成样本资讯库。3.根据权利要求1或2所述的基于自然语言的企业决策要素提取方法,其特征在于,获取企业公开资讯的步骤之前,还包括:建立事件词库以及实体词库。4.根据权利要求3所述的基于自然语言的企业决策要素提取方法,其特征在于,利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤之后,还包括:将事件词库中的词根据自然语义进行同义词合并;将实体词库中的词根据自然语义进行同义词合并。5.根据权利要求4所述的基于自然语言的企业决策要素提取方法,其特征在于,对所述企业动态信息进行清洗,获取分词的步骤,包括以下具体步骤:对所述企业动态信息的文本内容进行分段处理以及分句处理,获取每段文本以及每句文本;对每段文本以及每句文本进行分词处理,获取每段以及每句中的分词。6.根据权利要求5所述的基于自然语言的企业决策要素提取方法,其特征在于,判断所述分词是否与事件词库中的词同义的步骤之后,还包括:...
【专利技术属性】
技术研发人员:宋小鹏,田丁丁,
申请(专利权)人:前海梧桐深圳数据有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。