一种应用于人工智能内容生成的数据安全处理方法及系统技术方案

技术编号:39332075 阅读:17 留言:0更新日期:2023-11-12 16:07
本发明专利技术公开了一种应用于人工智能内容生成的数据安全处理方法及系统,本方法能够有效解决通过网络向云端服务器发送待处理文本的过程中容易出现泄露用户的隐私信息的问题;首先将待加密文字信息的各字符的顺序打乱以得到乱序文字信息,增加了待加密文字信息被泄露的难度;然后随机抽取乱序文字信息中的字符,并将抽取的字符作为待加密字符,将剩余的字符作为明文字符;并通过预设加密算法对待加密字符进行加密以得到密文字符,然后将明文字符和密文字符分别通过不同的网络通路发送至云服务器,能够有效防止明文字符和密文字符在网络传输过程中被泄露,进一步增加了待加密文字信息的安全性。息的安全性。息的安全性。

【技术实现步骤摘要】
一种应用于人工智能内容生成的数据安全处理方法及系统


[0001]本专利技术涉及人工智能
,具体涉及一种应用于人工智能内容生成的数据安全处理方法及系统。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是获取用户输入的语言文字,然后对语言文字进行解析以知晓语言文字表达的含义,比如用户向计算设备输入一段文字“这部电影太好看了”,计算设备通过解析理解用户对这部电影的评论情感是什么,这就是自然语言处理技术,即自然语言处理能够使得计算机对人类的自然语言能够可读并理解。
[0003]随着人工智能生成内容(Artificial Intelligence Generated Content,AIGC)技术的发展,基于人工智能的自然语言处理技术能够通过学习和理解人类的语言,进而直接和使用者进行对话,还能根据聊天的上下文进行互动,广泛应用于人机交互设备(例如智能音箱等)。
[0004]但由于自然语言处理模型使用时需要涉及大量的数据处理和分析,故将自然语言处理模型部署于云端服务器中,而用户在使用基于人工智能的自然语言处理技术时需要向部署于云端服务器的自然语言处理模型发送待处理文本,而待处理文本通常是对用户语音识别而生成的,容易包含用户的隐私信息,故通过网络向云端服务器发送待处理文本的过程中容易出现泄露用户的隐私信息的问题。

技术实现思路

[0005]本专利技术的主要目的是提供一种应用于人工智能内容生成的数据安全处理方法及系统,旨在解决通过网络向云端服务器发送待处理文本的过程中容易出现泄露用户的隐私信息的问题。
[0006]本专利技术提出的技术方案为:一种应用于人工智能内容生成的数据安全处理方法,应用于数据安全处理系统;所述系统包括云服务器,以及与云服务器通信连接的客户端;所述方法,包括:客户端获取文字信息,并判断文字信息是否包含敏感关键字词;若包含敏感关键字词,客户端将文字信息标记为待加密文字信息;客户端基于预设规则将待加密文字信息中各字符的排列顺序打乱以得到乱序文字信息;客户端基于待加密文字信息中敏感关键字词的数量确定第一数量;客户端于乱序文字信息中随机抽取第一数量个字符,然后将抽取的字符标记为待加密字符,将剩余的字符标记为明文字符,并生成包括所有明文字符的明文字符集;客户端基于预设加密算法依次将各待加密字符转换为对应的密文字符,并生成包括所有密文字符的密文字符集,然后将密文字符集和明文字符集建立对应关系;
客户端将明文字符集通过第一通路发送至云服务器;客户端将密文字符集通过第二通路发送至云服务器,其中,第二通路和第一通路不相同;云服务器基于预设加密算法对应的解密算法、彼此对应的明文字符集和密文字符集生成解密文字信息。
[0007]优选的,还包括:云服务器生成序号集,包括:云服务器生成第二数量个第一序号,其中,第一序号为从1开始,依次增大且增量为1的正整数,且第一序号的最大值为第二数量,第二数量大于第一数量;云服务器生成第二数量个第二序号,其中,第二序号为从1开始,依次增大且增量为1的正整数,且第二序号的最大值为第二数量;云服务器依次对每个第一序号进行关联操作,其中,关联操作的过程为:将随机抽取的任一个与当前进行关联操作的第一序号不相同且未被标记为已抽取序号的第二序号与当前进行关联操作的第一序号建立对应关系,并将抽取的第二序号标记为已抽取序号;当所有的第一序号均完成关联操作后,云服务器将全部的第一序号和每个第一序号对应的第二序号打包为序号集;云服务器将序号集发送至客户端;所述客户端基于预设规则将待加密文字信息中各字符的排列顺序打乱以得到乱序文字信息,包括:客户端基于序号集将待加密文字信息中各字符的顺序打乱以得到乱序文字信息。
[0008]优选的,所述客户端基于序号集将待加密文字信息中各字符的顺序打乱以得到乱序文字信息,包括:客户端获取待加密文字信息的总字符数;客户端截取序号集中位于前列且与总字符数数量相等的第一序号,以及与截取的各个第一序号分别对应的第二序号,并将截取的第一序号所对应的第二序号按照从小至大的顺序排序,然后将截取的第一序号所对应的第二序号重新赋值为排序序号;客户端将截取的第一序号,以及截取的第一序号对应的且重新赋值的第二序号打包为使用集;客户端依次将待加密文字信息中当前排序序号为使用集中第一序号的字符移动至使用集中对应的第二序号所对应的排序位置,以得到乱序文字信息。
[0009]优选的,所述客户端基于待加密文字信息中敏感关键字词的数量确定第一数量的计算公式为:,,式中,为第一数量;为待加密文字信息的总字符数;为待加密文字信息中敏感关键字词的数量,A为比例系数,取大于1的正数。
[0010]优选的,所述客户端将明文字符集通过第一通路发送至云服务器,包括:客户端获取明文字符于乱序文字信息中所处的排序号,并标记为明文序号,然后将明文字符与对应的明文序号建立对应关系;客户端将明文字符集、各明文字符对应的明文序号,以及使用集发送至云服务器;所述客户端将密文字符集通过第二通路发送至云服务器,包括:客户端获取待加密字符于乱序文字信息中所处的排序号,并标记为密文序号,然后将密文字符与对应的待加密字符对应的密文序号建立对应关系;客户端将密文字符集,以及各密文字符对应的密文序号发送至云服务器。
[0011]优选的,所述云服务器基于预设加密算法对应的解密算法、彼此对应的明文字符集和密文字符集生成解密文字信息,包括:云服务器基于预设加密算法对应的解密算法将获取的密文字符集中各密文字符转换为解密字符,然后将解密字符与对应的密文字符对应的密文序号建立对应关系;云服务器将使用集中与明文序号一致的第二序号所对应的第一序号作为明文字符集中与明文序号对应的明文字符所对应的恢复序号;云服务器将使用集中与密文序号一致的第二序号所对应的第一序号作为与密文序号对应的解密字符所对应的恢复序号;云服务器依次将各明文字符和解密字符按照对应恢复序号进行排序,以组合得到解密文字信息。
[0012]优选的,所述系统还包括多个中转服务器,云服务器和客户端均与中转服务器通信连接;第一通路为客户端与云服务器直接进行通讯的通讯路径;第二通路为客户端和云服务器之间通过中转服务器进行通讯的通讯路径;所述方法,还包括:中转服务器计算自身对应的泄露风险值,并将泄露风险值发送至客户端;所述客户端将密文字符集,以及各密文字符对应的密文序号发送至云服务器,包括:客户端将泄露风险最小的中转服务器标记为第一目标服务器,并将密文字符集,以及各密文字符对应的密文序号发送至第一目标服务器;第一目标服务器将密文字符集,以及各密文字符对应的密文序号发送至云服务器。
[0013]优选的,所述中转服务器计算自身对应的泄露风险值,并将泄露风险值发送至客户端,包括:中转服务器计算每次接收密文字符集,以及各密文字符对应的密文序号时所对应的单次风险值:,,式中,为第i次接收密文字符集,以及各密文字符对应的密文序号时所对应的单次风险值;中转服务器将每次接收到密文字符集,以及各密文字符对应的密文序号的时
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于人工智能内容生成的数据安全处理方法,其特征在于,应用于数据安全处理系统;所述系统包括云服务器,以及与云服务器通信连接的客户端;所述方法,包括:客户端获取文字信息,并判断文字信息是否包含敏感关键字词;若包含敏感关键字词,客户端将文字信息标记为待加密文字信息;客户端基于预设规则将待加密文字信息中各字符的排列顺序打乱以得到乱序文字信息;客户端基于待加密文字信息中敏感关键字词的数量确定第一数量;客户端于乱序文字信息中随机抽取第一数量个字符,然后将抽取的字符标记为待加密字符,将剩余的字符标记为明文字符,并生成包括所有明文字符的明文字符集;客户端基于预设加密算法依次将各待加密字符转换为对应的密文字符,并生成包括所有密文字符的密文字符集,然后将密文字符集和明文字符集建立对应关系;客户端将明文字符集通过第一通路发送至云服务器;客户端将密文字符集通过第二通路发送至云服务器,其中,第二通路和第一通路不相同;云服务器基于预设加密算法对应的解密算法、彼此对应的明文字符集和密文字符集生成解密文字信息。2.根据权利要求1所述的一种应用于人工智能内容生成的数据安全处理方法,其特征在于,还包括:云服务器生成序号集,包括:云服务器生成第二数量个第一序号,其中,第一序号为从1开始,依次增大且增量为1的正整数,且第一序号的最大值为第二数量,第二数量大于第一数量;云服务器生成第二数量个第二序号,其中,第二序号为从1开始,依次增大且增量为1的正整数,且第二序号的最大值为第二数量;云服务器依次对每个第一序号进行关联操作,其中,关联操作的过程为:将随机抽取的任一个与当前进行关联操作的第一序号不相同且未被标记为已抽取序号的第二序号与当前进行关联操作的第一序号建立对应关系,并将抽取的第二序号标记为已抽取序号;当所有的第一序号均完成关联操作后,云服务器将全部的第一序号和每个第一序号对应的第二序号打包为序号集;云服务器将序号集发送至客户端;所述客户端基于预设规则将待加密文字信息中各字符的排列顺序打乱以得到乱序文字信息,包括:客户端基于序号集将待加密文字信息中各字符的顺序打乱以得到乱序文字信息。3.根据权利要求2所述的一种应用于人工智能内容生成的数据安全处理方法,其特征在于,所述客户端基于序号集将待加密文字信息中各字符的顺序打乱以得到乱序文字信息,包括:客户端获取待加密文字信息的总字符数;客户端截取序号集中位于前列且与总字符数数量相等的第一序号,以及与截取的各个第一序号分别对应的第二序号,并将截取的第一序号所对应的第二序号按照从小至大的顺序排序,然后将截取的第一序号所对应的第二序号重新赋值为排序序号;
客户端将截取的第一序号,以及截取的第一序号对应的且重新赋值的第二序号打包为使用集;客户端依次将待加密文字信息中当前排序序号为使用集中第一序号的字符移动至使用集中对应的第二序号所对应的排序位置,以得到乱序文字信息。4.根据权利要求3所述的一种应用于人工智能内容生成的数据安全处理方法,其特征在于,所述客户端基于待加密文字信息中敏感关键字词的数量确定第一数量的计算公式为:,,式中,为第一数量;为待加密文字信息的总字符数;为待加密文字信息中敏感关键字词的数量,A为比例系数,取大于1的正数。5.根据权利要求3所述的一种应用于人工智能内容生成的数据安全处理方法,其特征在于,所述客户端将明文字符集通过第一通路发送至云服务器,包括:客户端获取明文字符于乱序文字信息中所处的排序号,并标记为明文序号,然后将明文字符与对应的明文序号建立对应关系;客户端将明文字符集、各明文字符对应的明文序号,以及使用集发送至云服务器;所述客户端将密文字符集通过第二通路发送至云服务器,包括:客户端获取待加密字符于乱序文字信息中所处的排序号,并标记为密文序号,然后将密文字符与对应的待加密字符对应的密文序号建立对应关系;客户端将密文字符集,以及各密文字符对应的密文序号发送至云服务器。6.根据权利要求5所述的一种应用于人工智能内容生成的数据安全...

【专利技术属性】
技术研发人员:邓正秋彭立宏
申请(专利权)人:湖南马栏山视频先进技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1