一种基于知识库推理的相似上市公司企业检索分类方法及系统技术方案

技术编号:16038265 阅读:76 留言:0更新日期:2017-08-19 20:06
本发明专利技术公开了一种基于知识库推理的相似上市公司企业检索分类方法及系统,所述方法采用的具体步骤如下:获取公司信息、解析存储数据、整合分析数据、建立企业实体知识库。所述系统包括公司企业信息获取模块、信息提取结构化模块、关键词优化检索模块和相似矩阵处理知识库构建模块。本发明专利技术可以解决传统的分类方式覆盖面不全和传统的对标企业检索系统的分类不完善以及检索效率较低等技术问题。

【技术实现步骤摘要】
一种基于知识库推理的相似上市公司企业检索分类方法及系统
本专利技术涉及一种金融投资领域的信息分析检索技术。
技术介绍
在金融投资领域中,投资者需要对标的企业进行详细的业务模式分析,财务分析,以及合理的企业价值估值。对于标的公司的研究,经常需要有同行业或同领域竞争公司的企业经营数据作为参考支持,使用合适的估值方式模型,以建模或者预测该公司的预期经营数据,发现潜在的投资标的。常用的寻找同领域或同行业公司方式,主要是通过已有的行业分类模型,如全球行业分类标准(GICS)、罗素全球行业(RGS)、行业分类基准(ICB)等投资型分类系统,以及国民经济行业分类、上市企业行业分类等管理型政府行业分类系统。由于新兴技术的不断进步,多领域多行业交融的公司企业相继涌现,传统的分类方式很难完全覆盖新型
公司。信息检索技术是从信息资源集合获得与信息需求相关的信息资源的活动。检索可以基于全文或者其他基于内容的索引。Web搜索引擎既是最常见的信息检索应用程序。在信息检索过程中,每一次查询会对信息资源对象进行标识排序,并整理存储不同对象之间的关联程度以及排名信息。信息对象通常是内容集合或者数据库存储的实体数本文档来自技高网...
一种基于知识库推理的相似上市公司企业检索分类方法及系统

【技术保护点】
一种基于知识库推理的相似上市公司企业检索分类方法,采用的具体步骤如下:1).获取公司信息,对所有上市公司企业进行数据搜集,包括上市公司招股说明书、年度报告、重要公告、财务报告、行业研究报告、专利信息、诉讼信息、招标投标信息和企业重要新闻;2).解析存储数据,通过解析器将爬取的数据解析为适当格式,存储到数据库中,解析器包含类型分析器、格式分析器,用以针对复杂的数据类型与格式,并将其解析为统一格式;3).整合分析数据,对已有数据进行数据去重、内容结构信息提取和信息分类处理,针对每一家具体企业,建立企业数据画像,从主营业务构成、参控股公司关系、财务指标角度,对企业公司进行分类描述;4).建立企业实体...

【技术特征摘要】
1.一种基于知识库推理的相似上市公司企业检索分类方法,采用的具体步骤如下:1).获取公司信息,对所有上市公司企业进行数据搜集,包括上市公司招股说明书、年度报告、重要公告、财务报告、行业研究报告、专利信息、诉讼信息、招标投标信息和企业重要新闻;2).解析存储数据,通过解析器将爬取的数据解析为适当格式,存储到数据库中,解析器包含类型分析器、格式分析器,用以针对复杂的数据类型与格式,并将其解析为统一格式;3).整合分析数据,对已有数据进行数据去重、内容结构信息提取和信息分类处理,针对每一家具体企业,建立企业数据画像,从主营业务构成、参控股公司关系、财务指标角度,对企业公司进行分类描述;4).建立企业实体知识库,通过使用中文分词、词性标注、识别标注、规则匹配技术,对企业信息进行段落和句子级别的结构分析,并提取出实体及关系;之后通过词向量模型,并经过倒排索引、关键词优化、相似度排名、实体关系匹配步骤,建立企业实体知识库;5).根据检索关键词,返回标的企业的相关对标企业信息。2.根据权利要求1所述的一种基于知识库推理的相似上市公司企业检索分类方法,解析存储数据是根据获取到的上市公司企业经营数据,针对不同类型,进行解析提取;将以上获取数据统一提交到类型解析器,针对不同格式类型的数据,解析器包含了相应的数据类型接口模块,对相应数据进行识别解析处理;之后通过格式分析器分析数据的不同格式,将各种公司数据转化为统一的格式,解析完成后,需要将数据存储到数据库中保存。3.根据权利要求1所述的一种基于知识库推理的相似上市公司企业检索分类方法,整合分析数据,在具有统一格式的数据基础之上,还需要进一步的清理数据;首先需要对数据去重,对于公司所包含的大量描述数据、财务数据、新闻数据,第一层格式分析处理后还需要对现有数据进行清理检测,去掉重复数据,去重后的数据仍然包含大量无用标签、格式等冗余数据,还需要使用基于规则的识别技术对清理后的数据进行提取处理,筛出有用数据,最后根据公司情况,对数据进行主要包括财务模型、同业企业对比、产品结构、销售模式、客户与市场在内的类别分类。4.根据权利要求1所述的一种基于知识库推理的相似上市公司企业检索分类方法,所述建立企业实体知识库,对数据建立全文索引,利用分布式搜索引擎技术对结构化...

【专利技术属性】
技术研发人员:郑锦光张梦迪丁海星曹辉鲍捷马新磊
申请(专利权)人:北京文因互联科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1