一种用于在线业务会话交互的大数据安全分析方法及系统技术方案

技术编号:38145787 阅读:8 留言:0更新日期:2023-07-08 10:03
本发明专利技术提供一种用于在线业务会话交互的大数据安全分析方法及系统,在获取目标会话安全检测文本和参考会话安全检测文本的共性度量值时,还引入了异常文本描述集的检测偏移指数对共性度量值的贡献,而不是只分析异常文本描述集对应的异常文本描述数组,从而规避由于会话安全检测文本中存在扰动造成异常文本描述数组难以精准输出风险主题的词向量的问题,以便提高风险主题判别的精度,减少文本分析时所产生的偏差。在确定出目标会话安全检测文本与参考会话安全检测文本为相似文本之后,能够以参考会话安全检测文本的相关安全分析策略为基准,对目标会话安全检测文本进行一系列的安全分析,从而提高目标会话安全检测文本的安全分析精度和效率。全分析精度和效率。全分析精度和效率。

【技术实现步骤摘要】
一种用于在线业务会话交互的大数据安全分析方法及系统


[0001]本专利技术涉及大数据安全
,尤其涉及一种用于在线业务会话交互的大数据安全分析方法及系统。

技术介绍

[0002]大数据时代来临,各行业数据规模呈TB级增长,高价值数据源在大数据产业链中占据至关重要的核心地位。随着各行业的线上业务升级,业务交互大多通过在线会话实现,由此所产生的会话大数据的信息量也不容忽视,如何确保会话大数据安全性是现目前亟需重视的问题。传统的数据安全分析技术大多通过对检测文本进行分析实现,但是这种方式存在效率和精度低下的问题。

技术实现思路

[0003]本专利技术提供一种用于在线业务会话交互的大数据安全分析方法及系统,为实现上述技术目的,本专利技术采用如下技术方案。
[0004]第一方面是一种用于在线业务会话交互的大数据安全分析方法,应用于人工智能服务系统,所述方法包括:对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组;对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,所述第一文本检测变量用于表征所述第一异常文本描述集反映所述目标会话安全检测文本中风险主题词向量的检测偏移指数;依据所述第一异常文本描述数组、所述第一文本检测变量以及参考会话安全检测文本的第二异常文本描述集对应的第二异常文本描述数组、所述第二异常文本描述集对应的第二文本检测变量,获取所述目标会话安全检测文本和所述参考会话安全检测文本之间的共性度量值,所述第二文本检测变量用于表征所述第二异常文本描述集反映所述参考会话安全检测文本中风险主题词向量的检测偏移指数;在所述共性度量值大于设定度量值的基础上,确定所述目标会话安全检测文本与所述参考会话安全检测文本为相似文本,并基于所述参考会话安全检测文本对所述目标会话安全检测文本进行安全分析。
[0005]在一些可选的实施例中,所述对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组。
[0006]在一些可选的实施例中,所述对所述第一异常文本描述集进行处理,得到所述第
一异常文本描述集对应的第一文本检测变量,包括:通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量。
[0007]在一些可选的实施例中,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过所述文本描述挖掘单元,对所述目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集;通过所述文本描述投影单元,对所述第一异常文本描述集进行文本描述投影,得到所述第一异常文本描述集对应的第一异常文本描述数组。
[0008]在一些可选的实施例中,所述通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量之前,所述方法还包括:根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网;在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网。
[0009]在一些可选的实施例中,所述根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网,包括:获取所述会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例;通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组;依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网。
[0010]在一些可选的实施例中,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组,包括:通过所述文本描述挖掘单元,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集;通过所述文本描述投影单元,对所述异常文本解析描述集进行文本描述投影,得到所述异常文本解析描述集对应的异常文本解析数组。
[0011]在一些可选的实施例中,所述Transformer网络还包括网络代价生成子网,所述网络代价生成子网包括每个风险主题标签对应的置信度描述数组,所述依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网,包括:
通过所述网络代价生成子网,按照所述会话安全检测文本样例所对应风险主题标签对应的置信度描述数组对所述异常文本解析数组进行强化操作,得到所述异常文本解析数组对应的异常文本描述强化数组;获取所述异常文本描述强化数组和所述异常文本描述数组样例之间的第二调校代价指标,所述第二调校代价指标表示所述异常文本描述强化数组和所述异常文本描述数组样例之间的比较结果;依据所述第二调校代价指标,调校所述文本描述挖掘子网和所述网络代价生成子网。
[0012]在一些可选的实施例中,所述在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网,包括:获取所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,所述关键文本描述数组表示所述风险主题标签对应的风险主题词向量;通过所述描述特征解析子网,对所述异常文本解析描述集进行处理,得到所述异常文本解析描述集对应的文本检测变量解析结果,所述文本检测变量解析结果用于表征所述异常文本解析描述集反映所述会话安全检测文本样例中风险主题词向量的检测偏移指数;依据所述异常文本解析数组、所述关键文本描述数组和所述文本检测变量解析结果,获取第三调校代价指标,所述第三调校代价指标表示所述异常文本解析描述集对应的文本检测变量解析结果的训练代价;依据所述第三调校代价指标,调校所述描述特征解析子网。
[0013]在一些可选的实施例中,所述依据所述异常文本解析数组、所述关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于在线业务会话交互的大数据安全分析方法,其特征在于,应用于人工智能服务系统,所述方法包括:对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组;对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,所述第一文本检测变量用于表征所述第一异常文本描述集反映所述目标会话安全检测文本中风险主题词向量的检测偏移指数;依据所述第一异常文本描述数组、所述第一文本检测变量以及参考会话安全检测文本的第二异常文本描述集对应的第二异常文本描述数组、所述第二异常文本描述集对应的第二文本检测变量,获取所述目标会话安全检测文本和所述参考会话安全检测文本之间的共性度量值,所述第二文本检测变量用于表征所述第二异常文本描述集反映所述参考会话安全检测文本中风险主题词向量的检测偏移指数;在所述共性度量值大于设定度量值的基础上,确定所述目标会话安全检测文本与所述参考会话安全检测文本为相似文本,并基于所述参考会话安全检测文本对所述目标会话安全检测文本进行安全分析。2.根据权利要求1所述的方法,其特征在于,所述对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组。3.根据权利要求2所述的方法,其特征在于,所述对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,包括:通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量。4.根据权利要求2所述的方法,其特征在于,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过所述文本描述挖掘单元,对所述目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集;通过所述文本描述投影单元,对所述第一异常文本描述集进行文本描述投影,得到所述第一异常文本描述集对应的第一异常文本描述数组。5.根据权利要求3所述的方法,其特征在于,所述通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量之前,所述方法还包括:根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网;在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和
所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网;其中,所述根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网,包括:获取所述会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例;通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组;依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网;其中,所述文本描述挖掘子网包括文本描述挖掘单...

【专利技术属性】
技术研发人员:沈鹏
申请(专利权)人:宁夏云源信息科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1