基于自然语言处理风险预警方法、系统、设备及介质技术方案

技术编号：29205638 阅读：17 留言：0更新日期：2021-07-10 00:41

本发明专利技术提供一种基于自然语言处理风险预警方法、系统、设备及介质，包括：获取待测文本数据集合，对待测文本数据集合中的文本数据进行预处理，得到有效文本数据集合；利用自然语言处理算法处理有效文本数据集合，得到文本特征向量；基于文本特征向量结合知识图谱、注意力机制和双向GRU网络构建文本分类模型，利用文本分类模型对待测文本数据进行分类得到分类结果；根据分类结果匹配相应预警指标，比较预警指标与待测文本数据内相应指标，判断待测文本数据的风险等级；本发明专利技术通过对分类结果所属不同预警领域选择不同的预警指标，按照预警指标筛选与其匹配的指标参数进行比较，从而实现风险预警，相对传统预警方式，风险预警的效率与精度更高。率与精度更高。率与精度更高。

全部详细技术资料下载

【技术实现步骤摘要】
基于自然语言处理风险预警方法、系统、设备及介质

[0001]本专利技术属于数据处理
，特别是涉及一种基于自然语言处理风险预警方法、系统、设备及介质。

技术介绍

[0002]随着信息技术的不断发展，计算机已然成为了信息传递的一种重要媒介，因此将图像中的文字转换为计算机可进行处理的格式有利于人们对信息的理解、加工和传递。许多视觉领域内和文本相关的任务，如图像检索、风险预测或挖掘等都需要以精确的文本识别结果进行构建。
[0003]目前风险预警引擎系统大多采用互联网+监管领域风险预警，通过提前构建数据分析模型，基于海量数据分析出潜在的风险预警信号，并驱动监管主体进行针对性监管，从而缩小监管盲区、提高监管的精准度。
[0004]然而，由于数据普遍是文本格式，存在无结构、不抽象、无特征等低质量特点，因此，导致无法精准分析该类数据，不利于对海量数据的深层次挖掘。

技术实现思路

[0005]鉴于以上所述现有技术的缺点，本专利技术的目的在于提供一种基于自然语言处理风险预警方法、系统、设备及介质，用于解决现有技术基于自然语言处理风险预警时，无法精准预测风险的问题。
[0006]为实现上述目的及其他相关目的，本专利技术的第一方面提供一种基于自然语言处理风险预警方法，包括：获取待测文本数据集合，对所述待测文本数据集合中的文本数据进行预处理，得到有效文本数据集合；利用自然语言处理算法处理所述有效文本数据集合，得到文本特征向量；基于所述文本特征向量结合知识图谱、注意力机制和双向GRU网络构建文本分类...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言处理风险预警方法，其特征在于，包括：获取待测文本数据集合，对所述待测文本数据集合中的文本数据进行预处理，得到有效文本数据集合；利用自然语言处理算法处理所述有效文本数据集合，得到文本特征向量；基于所述文本特征向量结合知识图谱、注意力机制和双向GRU网络构建文本分类模型，利用所述文本分类模型对待测文本数据进行分类得到分类结果；根据所述分类结果匹配相应的预警指标，比较所述预警指标与所述待测文本数据内相应指标参数，判断所述待测文本数据的风险等级。2.根据权利要求1所述的基于自然语言处理风险预警方法，其特征在于，构建所述文本分类模型的步骤，包括：将所述文本特征向量输入到双向GRU网络，得到第一文本特征向量，利用自注意力层对所述第一文本特征向量进行加权计算，得到第二文本特征向量；调用知识库中概念图谱对所述文本特征向量进行概念化处理，得到由概念向量集合构成的概念集；所述第二文本特征向量经池化层处理得到第三特征向量；在所述概念集中引入注意力机制，计算概念集中第x个向量与第y个第三特征向量之间的关系权重，通过获取每个概念向量的注意力权重，对每个概念向量进行加权计算得到概念集特征向量；结合所述第二文本特征向量与概念集特征向量，利用反向传播算法进行训练得到文本分类模型。3.根据权利要求2所述的基于自然语言处理风险预警方法，其特征在于，还包括：通过最小化交叉熵损失函数来优化文本分类模型，所述交叉熵损失函数为：其中，M为训练集大小，N为类别数，R为预测类别，λ||θ||2为正则项，R
’
为实际类别。4.根据权利要求1所述的基于自然语言处理风险预警方法，其特征在于，所述获取待测文本数据集合，对所述待测文本数据集合中的文本数据进行预处理，得到有效文本数据集合的步骤，包括：删除所述待预测文本数据集合中地名与时间，得到删除后的第一文本数据集合；对所述第一文本数据集合采用分词算法进行分词，得到分词后的第二文本数据集合；对所述第二文本数据集合采用词语过滤方法进行过滤，得到有效文本数据集合，所述词语过滤方法至少包括停用...

【专利技术属性】
技术研发人员：姚娟娟，钟南山，樊代明，
申请(专利权)人：明品云北京数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人