企业关联关系抽取方法、装置、存储介质和电子装置制造方法及图纸

技术编号:28839246 阅读:20 留言:0更新日期:2021-06-11 23:37
本发明专利技术实施例提供了一种企业关联关系抽取方法、装置、存储介质和电子装置,该方法包括:接收企业文本数据,根据该企业文本数据获取主实体公司名称和该主实体公司与客实体公司之间的关联关系;根据金融词库获取该客实体公司名称;根据获取的该主实体公司名称、该客实体公司名称以及该关联关系进行企业关联关系抽取,得到关联关系三元组。通过本发明专利技术,由于量化企业文本数据,高效分析文本中的企业关联关系,解决了相关技术中人工筛选企业关联关系分析效率低的问题,进而达到了提高文本数据处理效率、快速抽取企业关联关系的效果。

【技术实现步骤摘要】
企业关联关系抽取方法、装置、存储介质和电子装置
本专利技术实施例涉及文本处理
,具体而言,涉及一种企业关联关系抽取方法、装置、存储介质和电子装置。
技术介绍
互联网上充斥着各种企业舆情信息。目前,实体关系分类方法主要基于纯文本的分析得到的实体关系分类。在企业文本关联关系分析领域,舆情信息存在来源不可控、描述多样性等问题,导致识别效果较差,关系无法用于真实生成环境。如何从海量的企业文本中找寻出有意义的企业关联关系,就显得尤为迫切,也是现在的研究重点。在分析包含企业关联关系的文本文件时,相关方法是通过人工进行筛选,进行人工分析,但是由于文本信息数据量巨大,人工逐条耗时耗力,所以分析效率较低,速度很慢。针对相关技术中人工筛选企业关联关系分析效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种企业关联关系抽取方法、装置、存储介质和电子装置,以至少解决相关技术中人工筛选企业关联关系分析效率低的问题。根据本专利技术的一个实施例,提供了一种企业关联关系抽取方法,包括:接收企业文本文档来自技高网...

【技术保护点】
1.一种企业关联关系抽取方法,其特征在于,包括:/n接收企业文本数据,根据所述企业文本数据获取主实体公司名称和所述主实体公司与客实体公司之间的关联关系;/n根据金融词库获取所述客实体公司名称;/n根据获取的所述主实体公司名称、所述客实体公司名称以及所述关联关系进行企业关联关系抽取,得到关联关系三元组。/n

【技术特征摘要】
1.一种企业关联关系抽取方法,其特征在于,包括:
接收企业文本数据,根据所述企业文本数据获取主实体公司名称和所述主实体公司与客实体公司之间的关联关系;
根据金融词库获取所述客实体公司名称;
根据获取的所述主实体公司名称、所述客实体公司名称以及所述关联关系进行企业关联关系抽取,得到关联关系三元组。


2.根据权利要求1所述的方法,其特征在于,接收企业文本数据,根据所述企业文本数据获取主实体公司名称和所述主实体公司与客实体公司之间的关联关系,包括:
接收企业文本数据,对所述企业文本数据进行命名实体识别,得到主实体公司名称;
对所述企业文本数据进行词性识别,得到所述主实体公司与客实体公司之间的关联关系。


3.根据权利要求1所述的方法,其特征在于,根据金融词库获取所述客实体公司名称,包括:
对所述金融词库进行迁移学习,得到所述金融词库的词向量;
对所述金融词库的词向量进行命名实体识别,得到所述客实体公司名称。


4.根据权利要求1或3所述的方法,其特征在于,还包括:
根据所述金融词库获取所述主实体公司名称。


5.根据权利要求1所述的方法,其特征在于,在根据金融词库获取所述客实体公司名称之前,还包括:
根据至少以下之一获取所述金融词库:企业财报文本、金融百科、金融新闻语料、金融经济书籍、经济微博论坛。


6.一种企业关联关系抽取装置,其特征在于,包括:
第一获取模块,用于接收企业文本数据,根据所述企业文本数据获取主实体公司名称和所述主实体公司与...

【专利技术属性】
技术研发人员:马小龙祝世虎
申请(专利权)人:中国光大银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1