【技术实现步骤摘要】
本专利技术属于数据分析,具体属于基于nlp的事件文本特征关联分析方法、系统及介质。
技术介绍
1、在各类实际的生产生活中,事件的描述信息通常以长文本的方式记录下来,这些文本保存了丰富的有关事件的重要信息。然而,由于文本的复杂性和多样性,计算机很难对这些信息进行快速且有效的批量处理。这种情况对于自动化处理、数据分析和业务决策等任务来说构成了挑战。
2、经过检索,和本专利技术最接近的现有技术为cn113722489a,一种基于nlp算法的关系分析方法,包括以下步骤:s1、建立标准库;s2、建立人员库、事件库,分配唯一标识;s3、通过nlp算法从半结构化数据中提取对应的要素;
3、s4、通过nlp算法从半结构化数据的上下文中提取要素关联关系;s5、对标准要素进行清洗转换,将清洗转换后的标准要素与标准库进行匹配;s6、对关联标准要素的人员情况及多人共事件情况进行聚类,对相似的人员要素进行合并;
4、s7、基于已分配唯一标识的人员库,对要素关联关系中的人员实体更新为唯一标识。
5、1、该专利主要识别
...【技术保护点】
1.一种基于NLP的文本特征关联分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述对事件描述文本数据进行包括数据清洗在内的预处理,具体包括:
3.根据权利要求1所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述基于NLP的事件特征提取方法,具体步骤如下:
4.根据权利要求3所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述基于聚类的思想,计算文本相似度作为词语之间距离的度量方式,设定可调整的阈值,实现相同实体不同名称的合并和标准化,具体包括:
>5.根据权利...
【技术特征摘要】
1.一种基于nlp的文本特征关联分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述对事件描述文本数据进行包括数据清洗在内的预处理,具体包括:
3.根据权利要求1所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述基于nlp的事件特征提取方法,具体步骤如下:
4.根据权利要求3所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述基于聚类的思想,计算文本相似度作为词语之间距离的度量方式,设定可调整的阈值,实现相同实体不同名称的合并和标准化,具体包括:
5.根据权利要求4所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述采用apriori算法对事件进行分析,挖掘各事件特征间的关联关系,具体包括:
6.根据权利...
【专利技术属性】
技术研发人员:陈益,廖飞,杨若浩,杨康,徐璐璐,林嘉晨,
申请(专利权)人:重庆市信息通信咨询设计院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。