【技术实现步骤摘要】
一种用于在线业务会话交互的大数据安全分析方法及系统
[0001]本专利技术涉及大数据安全
,尤其涉及一种用于在线业务会话交互的大数据安全分析方法及系统。
技术介绍
[0002]大数据时代来临,各行业数据规模呈TB级增长,高价值数据源在大数据产业链中占据至关重要的核心地位。随着各行业的线上业务升级,业务交互大多通过在线会话实现,由此所产生的会话大数据的信息量也不容忽视,如何确保会话大数据安全性是现目前亟需重视的问题。传统的数据安全分析技术大多通过对检测文本进行分析实现,但是这种方式存在效率和精度低下的问题。
技术实现思路
[0003]本专利技术提供一种用于在线业务会话交互的大数据安全分析方法及系统,为实现上述技术目的,本专利技术采用如下技术方案。
[0004]第一方面是一种用于在线业务会话交互的大数据安全分析方法,应用于人工智能服务系统,所述方法包括:对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组;对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,所述第一文本检测变量用于表征所述第一异常文本描述集反映所述目标会话安全检测文本中风险主题词向量的检测偏移指数;依据所述第一异常文本描述数组、所述第一文本检测变量以及参考会话安全检测文本的第二异常文本描述集对应的第二异常文本描述数组、所述第二异常文本描述集对应的第二文本检测变量,获取所述目标会话安全检测文本和所述参考会话 ...
【技术保护点】
【技术特征摘要】
1.一种用于在线业务会话交互的大数据安全分析方法,其特征在于,应用于人工智能服务系统,所述方法包括:对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组;对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,所述第一文本检测变量用于表征所述第一异常文本描述集反映所述目标会话安全检测文本中风险主题词向量的检测偏移指数;依据所述第一异常文本描述数组、所述第一文本检测变量以及参考会话安全检测文本的第二异常文本描述集对应的第二异常文本描述数组、所述第二异常文本描述集对应的第二文本检测变量,获取所述目标会话安全检测文本和所述参考会话安全检测文本之间的共性度量值,所述第二文本检测变量用于表征所述第二异常文本描述集反映所述参考会话安全检测文本中风险主题词向量的检测偏移指数;在所述共性度量值大于设定度量值的基础上,确定所述目标会话安全检测文本与所述参考会话安全检测文本为相似文本,并基于所述参考会话安全检测文本对所述目标会话安全检测文本进行安全分析。2.根据权利要求1所述的方法,其特征在于,所述对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组。3.根据权利要求2所述的方法,其特征在于,所述对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,包括:通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量。4.根据权利要求2所述的方法,其特征在于,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过所述文本描述挖掘单元,对所述目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集;通过所述文本描述投影单元,对所述第一异常文本描述集进行文本描述投影,得到所述第一异常文本描述集对应的第一异常文本描述数组。5.根据权利要求3所述的方法,其特征在于,所述通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量之前,所述方法还包括:根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网;在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和
所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网;其中,所述根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网,包括:获取所述会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例;通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组;依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网;其中,所述文本描述挖掘子网包括文本描述挖掘单...
【专利技术属性】
技术研发人员:沈鹏,
申请(专利权)人:宁夏云源信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。