一种基于NLP的事件文本特征关联分析方法、系统及介质技术方案

技术编号：40054119 阅读：34 留言：0更新日期：2024-01-16 21:40

本发明专利技术请求保护一种基于NLP的文本特征关联分析方法，其特征在于，包括以下步骤：输入事件描述文本；对事件描述文本数据进行包括数据清洗在内的预处理；采用基于NLP的事件特征提取方法，将事件特征处理为能够批量进行挖掘分析的结构化数据；采用apriori算法对事件进行分析，挖掘各事件特征间的关联关系；采用多进程的方法，对apriori算法中统计各事件特征出现次数的计算过程进行优化；对发生的事件的特征及特征的关联关系进行监控，建立预警模型，从而实现事件特征异常变化的智能预警。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据分析，具体属于基于nlp的事件文本特征关联分析方法、系统及介质。

技术介绍

1、在各类实际的生产生活中，事件的描述信息通常以长文本的方式记录下来，这些文本保存了丰富的有关事件的重要信息。然而，由于文本的复杂性和多样性，计算机很难对这些信息进行快速且有效的批量处理。这种情况对于自动化处理、数据分析和业务决策等任务来说构成了挑战。

2、经过检索，和本专利技术最接近的现有技术为cn113722489a，一种基于nlp算法的关系分析方法，包括以下步骤：s1、建立标准库；s2、建立人员库、事件库，分配唯一标识；s3、通过nlp算法从半结构化数据中提取对应的要素；

3、s4、通过nlp算法从半结构化数据的上下文中提取要素关联关系；s5、对标准要素进行清洗转换，将清洗转换后的标准要素与标准库进行匹配；s6、对关联标准要素的人员情况及多人共事件情况进行聚类，对相似的人员要素进行合并；

4、s7、基于已分配唯一标识的人员库，对要素关联关系中的人员实体更新为唯一标识。

5、1、该专利主要识别...

【技术保护点】

1.一种基于NLP的文本特征关联分析方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于NLP的文本特征关联分析方法，其特征在于，所述对事件描述文本数据进行包括数据清洗在内的预处理，具体包括：

3.根据权利要求1所述的一种基于NLP的文本特征关联分析方法，其特征在于，所述基于NLP的事件特征提取方法，具体步骤如下：

4.根据权利要求3所述的一种基于NLP的文本特征关联分析方法，其特征在于，所述基于聚类的思想，计算文本相似度作为词语之间距离的度量方式，设定可调整的阈值，实现相同实体不同名称的合并和标准化，具体包括：>

5.根据权利...

【技术特征摘要】

1.一种基于nlp的文本特征关联分析方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于nlp的文本特征关联分析方法，其特征在于，所述对事件描述文本数据进行包括数据清洗在内的预处理，具体包括：

3.根据权利要求1所述的一种基于nlp的文本特征关联分析方法，其特征在于，所述基于nlp的事件特征提取方法，具体步骤如下：

4.根据权利要求3所述的一种基于nlp的文本特征关联分析方法，其特征在于，所述基于聚类的思想，计算文本相似度作为词语之间距离的度量方式，设定可调整的阈值，实现相同实体不同名称的合并和标准化，具体包括：

5.根据权利要求4所述的一种基于nlp的文本特征关联分析方法，其特征在于，所述采用apriori算法对事件进行分析，挖掘各事件特征间的关联关系，具体包括：

6.根据权利...

【专利技术属性】
技术研发人员：陈益，廖飞，杨若浩，杨康，徐璐璐，林嘉晨，
申请(专利权)人：重庆市信息通信咨询设计院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人