一种用于设置企业特性标签的方法及其系统技术方案

技术编号:16270049 阅读:53 留言:0更新日期:2017-09-22 21:43
本发明专利技术涉及一种用于设置企业特性标签的方法及其系统,该方法包括建立多维度企业特性标签指标体系;根据多维度企业特性标签指标体系,获取语料库;收集海量企业信息,提取标准化表达方式;将标准表达方式与语料库进行匹配,确定企业特性标签。本发明专利技术通过对海量企业信息植入多维度企业特性标签指标体系,实现自动过滤冗杂无效的企业信息,对有价值的非结构化的企业网络信息进行体系化的挖掘分析辅助用户对企业进行价值判断,准确得知企业的特性及价值,直观又快速,简单明呈现企业的全貌和不同特性,从企业的八个维度,市场、技术、产品、客户、组织、资金、服务、管理文化,对企业全景动态跟踪分析,精炼且直观,具象化感知企业全貌和不同特性。

【技术实现步骤摘要】
一种用于设置企业特性标签的方法及其系统
本专利技术涉及企业经营体系,更具体地说是指一种用于设置企业特性标签的方法及其系统。
技术介绍
企业数据泛指所有与企业经营相关的信息、资料,包括公司概况、产品信息、经营数据、研究成果等,其中不乏涉及商业机密。通常所说的企业数据是指狭义的企业数据,一般只包含公司概况介绍,包括公司经营范围、联系方式、企业规模等,通常是公开的数据。这些企业公开数据一般放置在互联网上,重复采用通识标签对这些数据进行标识,以达到对企业结构化信息的简单分类汇总,并没有对有价值的非结构化的企业网络数据进行体系化的挖掘分析并设置企业特性标签,以此精炼呈现企业特性,无法自动对冗余信息进行过滤,也无法准确得知企业的特性以及价值。因此,有必要设计一种用于设置企业特性标签的方法,实现自动过滤冗杂无效的企业信息,对有价值的非结构化的企业网络信息进行体系化的挖掘分析辅助用户对企业进行价值判断,准确得知企业的特性以及价值,直观又快速。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供一种用于设置企业特性标签的方法及其系统。为实现上述目的,本专利技术采用以下技术方案:一种用于设置企业特性标签的方法,所述方法包括:建立多维度企业特性标签指标体系;根据多维度企业特性标签指标体系,获取语料库;收集海量企业信息,提取标准化表达方式;将所述标准表达方式与语料库进行匹配,确定企业特性标签。其进一步技术方案为:根据多维度企业特性标签指标体系,获取语料库的步骤,包括以下具体步骤:根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。其进一步技术方案为:收集海量企业信息,提取标准化表达方式的步骤,包括以下具体步骤:收集海量企业信息,进行分析处理;筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;对所述样本企业信息提取标准化表达方式。其进一步技术方案为:收集海量企业信息,进行分析处理的步骤,包括以下具体步骤:利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。其进一步技术方案为:对所述样本企业信息提取标准化表达方式的步骤,包括以下具体步骤:根据语料库的分类,对所述样本企业信息进行分类汇总;将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。本专利技术还提供了一种用于设置企业特性标签的系统,包括体系建立单元、语料库获取单元、提取单元以及匹配确定单元;所述体系建立单元,用于建立多维度企业特性标签指标体系;所述语料库获取单元,用于根据多维度企业特性标签指标体系,获取语料库;所述提取单元,用于收集海量企业信息,提取标准化表达方式;所述匹配确定单元,用于将所述标准表达方式与语料库进行匹配,确定企业特性标签。其进一步技术方案为:所述语料库获取单元包括标准化提炼模块、非标准化提炼模块以及组合模块;所述标准化提炼模块,用于根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;所述非标准化提炼模块,用于根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;所述组合模块,用于将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。其进一步技术方案为:所述提取单元包括收集分析模块、筛选模块以及信息提炼模块;所述收集分析模块,用于收集海量企业信息,进行分析处理;所述筛选模块,用于筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;所述信息提炼模块,用于对所述样本企业信息提取标准化表达方式。其进一步技术方案为:所述收集分析模块包括采集子模块以及分析处理子模块;所述采集子模块,用于利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;所述分析处理子模块,用于对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。其进一步技术方案为:所述信息提炼模块包括分类汇总子模块以及表述子模块;所述分类汇总子模块,用于根据语料库的分类,对所述样本企业信息进行分类汇总;所述表述子模块,用于将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。本专利技术与现有技术相比的有益效果是:本专利技术的一种用于设置企业特性标签的方法,通过对海量企业信息植入多维度企业特性标签指标体系,对与多维度企业特性标签指标体系相关的特性样本企业信息进行匹配和确定企业特性标签,实现自动过滤冗杂无效的企业信息,对有价值的非结构化的企业网络信息进行体系化的挖掘分析辅助用户对企业进行价值判断,准确得知企业的特性以及价值,直观又快速,简单明呈现企业的全貌和不同特性,从企业的八个维度,市场、技术、产品、客户、组织、资金、服务、管理文化,对企业进行全景动态跟踪分析,精炼且直观,具象化感知企业的全貌和不同特性。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明图1为本专利技术具体实施例提供的一种用于设置企业特性标签的方法的流程图;图2为本专利技术具体实施例提供的获取语料库的具体流程图;图3为本专利技术具体实施例提供的提取标准化表达方式的具体流程图;图4为本专利技术具体实施例提供的收集海量企业信息进行分析处理的具体流程图;图5为本专利技术具体实施例提供的对样本企业信息提取标准化表达方式的具体流程图;图6为本专利技术具体实施例提供的一种用于设置企业特性标签的系统的结构框图;图7为本专利技术具体实施例提供的语料库获取单元的结构框图;图8为本专利技术具体实施例提供的提取单元的结构框图;图9为本专利技术具体实施例提供的收集分析模块的结构框图;图10为本专利技术具体实施例提供的信息提炼模块的结构框图.具体实施方式为了更充分理解本专利技术的
技术实现思路
,下面结合具体实施例对本专利技术的技术方案进一步介绍和说明,但不局限于此。如图1~10所示的具体实施例,本实施例提供的一种用于设置企业特性标签的方法,可以运用在企业公开信息使用者以及投资方寻求投资对象的过程中,实现自动过滤冗杂无效的企业信息,对有价值的非结构化的企业网络信息进行体系化的挖掘分析辅助用户对企业进行价值判断,准确得知企业的特性以及价值,直观又快速。如图1所示,本实施例提供的一种用于设置企业特性标签的方法,该方法包括:S1、建立多维度企业特性标签指标体系;S2、根据多维度企业特性标签指标体系,获取语料库;S3、收集海量企业信息,提取标准化表达方式;S4、将所述标准表达方式与语料库进行匹配,确定企业特性标签。对于上述的S1步骤,具体是基于在国内和世界市场上在某一领域领先或者由某一特性驱动领先的2000家企业为研究样本,结合世界领先管理学科学、行业经济技术分析学派等分析框架以及管理学技术,构建“企业特性标签”指标体系。该多维度企业特性标签指标体系,可以从企业的八个维度:市场、技术、产品、客户、组织、资金、服务、管理文化,对企业进行全景动态跟踪分析,精炼且直观,快速直达企业、具象化感知企业的全貌和不同特性。更进一步的,上述的S2步骤,根据多维度企业特性标签指标体系,获取本文档来自技高网
...
一种用于设置企业特性标签的方法及其系统

【技术保护点】
一种用于设置企业特性标签的方法,其特征在于,所述方法包括:建立多维度企业特性标签指标体系;根据多维度企业特性标签指标体系,获取语料库;收集海量企业信息,提取标准化表达方式;将所述标准表达方式与语料库进行匹配,确定企业特性标签。

【技术特征摘要】
1.一种用于设置企业特性标签的方法,其特征在于,所述方法包括:建立多维度企业特性标签指标体系;根据多维度企业特性标签指标体系,获取语料库;收集海量企业信息,提取标准化表达方式;将所述标准表达方式与语料库进行匹配,确定企业特性标签。2.根据权利要求1所述的一种用于设置企业特性标签的方法,其特征在于,根据多维度企业特性标签指标体系,获取语料库的步骤,包括以下具体步骤:根据多维度企业特性标签指标体系,提炼企业特性标签的标准化表达方式;根据多维度企业特性标签指标体系,对支撑企业特性标签的非标准化网络信息提取标准化表达方式;将企业特性标签的标准化表达方式以及非标准化网络信息提取标准化表达方式组成语料库。3.根据权利要求2所述的一种用于设置企业特性标签的方法,其特征在于,收集海量企业信息,提取标准化表达方式的步骤,包括以下具体步骤:收集海量企业信息,进行分析处理;筛选所述海量企业信息内与多维度企业特性标签指标体系相关联的各个特性的样本企业信息;对所述样本企业信息提取标准化表达方式。4.根据权利要求3所述的一种用于设置企业特性标签的方法,其特征在于,收集海量企业信息,进行分析处理的步骤,包括以下具体步骤:利用企业全名、企业简称、产品名称采集相关咨讯网站的海量企业信息;对采集所述海量企业信息进行清洗、归类、提取摘要、提取关键字、分词法以及语义分析。5.根据权利要求4所述的一种用于设置企业特性标签的方法,其特征在于,对所述样本企业信息提取标准化表达方式的步骤,包括以下具体步骤:根据语料库的分类,对所述样本企业信息进行分类汇总;将所述样本企业信息经过格式化数据处理和标准化表述,形成标准表达方式。6.一种用于设置企业特性标签的系统,其特征在于,包括体系建立单元、语料库获取单元、提取单元以及匹配确定单元;所述体系建立单元,用于建立多维度企业特性标签指标体系;所...

【专利技术属性】
技术研发人员:李小强
申请(专利权)人:前海梧桐深圳数据有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1