一种基于NLP的事件文本特征关联分析方法、系统及介质技术方案

技术编号:40054119 阅读:34 留言:0更新日期:2024-01-16 21:40
本发明专利技术请求保护一种基于NLP的文本特征关联分析方法,其特征在于,包括以下步骤:输入事件描述文本;对事件描述文本数据进行包括数据清洗在内的预处理;采用基于NLP的事件特征提取方法,将事件特征处理为能够批量进行挖掘分析的结构化数据;采用apriori算法对事件进行分析,挖掘各事件特征间的关联关系;采用多进程的方法,对apriori算法中统计各事件特征出现次数的计算过程进行优化;对发生的事件的特征及特征的关联关系进行监控,建立预警模型,从而实现事件特征异常变化的智能预警。

【技术实现步骤摘要】

本专利技术属于数据分析,具体属于基于nlp的事件文本特征关联分析方法、系统及介质。


技术介绍

1、在各类实际的生产生活中,事件的描述信息通常以长文本的方式记录下来,这些文本保存了丰富的有关事件的重要信息。然而,由于文本的复杂性和多样性,计算机很难对这些信息进行快速且有效的批量处理。这种情况对于自动化处理、数据分析和业务决策等任务来说构成了挑战。

2、经过检索,和本专利技术最接近的现有技术为cn113722489a,一种基于nlp算法的关系分析方法,包括以下步骤:s1、建立标准库;s2、建立人员库、事件库,分配唯一标识;s3、通过nlp算法从半结构化数据中提取对应的要素;

3、s4、通过nlp算法从半结构化数据的上下文中提取要素关联关系;s5、对标准要素进行清洗转换,将清洗转换后的标准要素与标准库进行匹配;s6、对关联标准要素的人员情况及多人共事件情况进行聚类,对相似的人员要素进行合并;

4、s7、基于已分配唯一标识的人员库,对要素关联关系中的人员实体更新为唯一标识。

5、1、该专利主要识别单个事件中各个要素之本文档来自技高网...

【技术保护点】

1.一种基于NLP的文本特征关联分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述对事件描述文本数据进行包括数据清洗在内的预处理,具体包括:

3.根据权利要求1所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述基于NLP的事件特征提取方法,具体步骤如下:

4.根据权利要求3所述的一种基于NLP的文本特征关联分析方法,其特征在于,所述基于聚类的思想,计算文本相似度作为词语之间距离的度量方式,设定可调整的阈值,实现相同实体不同名称的合并和标准化,具体包括:>

5.根据权利...

【技术特征摘要】

1.一种基于nlp的文本特征关联分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述对事件描述文本数据进行包括数据清洗在内的预处理,具体包括:

3.根据权利要求1所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述基于nlp的事件特征提取方法,具体步骤如下:

4.根据权利要求3所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述基于聚类的思想,计算文本相似度作为词语之间距离的度量方式,设定可调整的阈值,实现相同实体不同名称的合并和标准化,具体包括:

5.根据权利要求4所述的一种基于nlp的文本特征关联分析方法,其特征在于,所述采用apriori算法对事件进行分析,挖掘各事件特征间的关联关系,具体包括:

6.根据权利...

【专利技术属性】
技术研发人员:陈益廖飞杨若浩杨康徐璐璐林嘉晨
申请(专利权)人:重庆市信息通信咨询设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1