【技术实现步骤摘要】
采用人工智能算法的在线人机会话脱敏方法及软件产品
[0001]本专利技术涉及人工智能、大数据脱敏和人机对话
,尤其涉及一种采用人工智能算法的在线人机会话脱敏方法及软件产品。
技术介绍
[0002]在大数据仓库的建设过程中,数据安全扮演着重要角色。隐私或敏感数据的泄露会对数据主体(客户,员工和公司)的财产、名誉、人身安全、以及合法利益造成严重损害。这就要求对数据本身的敏感程度进行安全级别划分。数据有了安全等级的划分,才能更好管理对数据访问控制,以此来保护好数据安全。
[0003]大数据脱敏(Big data Masking),是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样可以使数据本身的安全等级降级,就可以在开发、测试和其它非生产环境以及外包或云计算环境中安全地使用脱敏后的真实数据集。
[0004]随着人工智能(Artificial Intelligence)和人机对话(man
‑
machine dialog)的不断发展,在线会话的应用领域不断扩大(诸如元宇宙服务咨询场景、数字孪生业务问答场景以及在线社交聊天场景等),大量的携带了隐私敏感信息的在线人机会话文本充斥在移动互联网中,而如何针对这些在线人机会话文本进行高质量的会话脱敏保护,是现目前工作的重中之重。
技术实现思路
[0005]本专利技术提供一种采用人工智能算法的在线人机会话脱敏方法及软件产品,会话大数据脱敏服务器所应用的目标AI文本大数据脱敏算法至少利用了动态的离散映射关系 ...
【技术保护点】
【技术特征摘要】
1.一种采用人工智能算法的在线人机会话脱敏方法,其特征在于,应用于会话大数据脱敏服务器,所述方法包括:获得满足会话大数据脱敏条件的目标在线人机会话文本和目标AI文本大数据脱敏算法,所述目标AI文本大数据脱敏算法至少利用了动态的离散映射关系网实现调试优化;将所述目标在线人机会话文本加载到所述目标AI文本大数据脱敏算法,得到所述目标在线人机会话文本对应的隐私文本语义离散映射表征;结合所述目标在线人机会话文本对应的隐私文本语义离散映射表征与所述目标AI文本大数据脱敏算法中的离散映射关系网获得会话文本脱敏匹配策略。2.根据权利要求1所述的方法,其特征在于,所述目标AI文本大数据脱敏算法的调试步骤包括:获得在线人机会话文本样例和待调试的AI文本大数据脱敏算法,所述待调试的AI文本大数据脱敏算法包括文本语义挖掘组件、语义离散映射组件和离散映射关系网组件,所述文本语义挖掘组件用于获得所述在线人机会话文本样例对应的会话文本语义表征,所述语义离散映射组件用于获得所述会话文本语义表征对应的隐私文本语义离散映射表征,所述离散映射关系网组件用于输出离散映射关系网,所述离散映射关系网伴随所述待调试的AI文本大数据脱敏算法的优化进行优化;利用所述文本语义挖掘组件获得所述在线人机会话文本样例对应的会话文本语义表征样例;利用所述语义离散映射组件获得所述会话文本语义表征样例对应的隐私文本语义离散映射表征样例;结合所述隐私文本语义离散映射表征样例和所述离散映射关系网确定目标算法调试代价变量;结合所述目标算法调试代价变量对所述待调试的AI文本大数据脱敏算法进行优化,得到目标AI文本大数据脱敏算法;其中,所述结合所述隐私文本语义离散映射表征样例和所述离散映射关系网确定目标算法调试代价变量,包括:结合所述隐私文本语义离散映射表征样例和所述离散映射关系网,确定辅助算法调试代价变量,所述辅助算法调试代价变量包括调整偏移算法调试代价变量和调整评价算法调试代价变量中的至少一种;结合所述辅助算法调试代价变量与所述辅助算法调试代价变量对应的置信度,确定所述目标算法调试代价变量;其中,所述辅助算法调试代价变量包括调整偏移算法调试代价变量;所述结合所述隐私文本语义离散映射表征样例和所述离散映射关系网,确定辅助算法调试代价变量,包括:结合所述离散映射关系网获得所述隐私文本语义离散映射表征样例对应的隐私文本语义调整表征;结合所述隐私文本语义调整表征和所述隐私文本语义离散映射表征样例,确定所述调整偏移算法调试代价变量。3.根据权利要求2所述的方法,其特征在于,所述结合所述离散映射关系网获得所述隐
私文本语义离散映射表征样例对应的隐私文本语义调整表征,包括:对所述隐私文本语义离散映射表征样例进行拆解,得到多个局部隐私离散映射表征,每个局部隐私离散映射表征的尺度相同;结合所述离散映射关系网和所述多个局部隐私离散映射表征获得所述每个局部隐私离散映射表征对应的隐私要素转换特征;将所述每个局部隐私离散映射表征对应的隐私要素转换特征进行融合,得到所述隐私文本语义离散映射表征样例对应的隐私文本语义调整表征;其中,所述结合所述离散映射关系网和所述多个局部隐私离散映射表征获得所述每个局部隐私离散映射表征对应的隐私要素转换特征,包括:结合所述离散映射关系网获得每个子表征对应的多个离散映射关系网;对于任一局部隐私离散映射表征,确定所述任一局部隐私离散映射表征与所述任一局部隐私离散映射表征所在语义集对应的多个离散映射关系网之间的区别评分,将区别评分达标的离散映射关系网作为所述任一局部隐私离散映射表征对应的隐私要素转换特征。4.根据权利要求2所述的方法,其特征在于,所述结合所述隐私文本语义调整表征和所述隐私文本语义离散映射表征样例,确定所述调整偏移算法调试代价变量,包括:将所述隐私文本语义调整表征和所述隐私文本语义离散映射表征样例之间的区别评分作为所述调整偏移算法调试代价变量。5.根据权利要求2所述的方法,其特征在于,所述辅助算法调试代价变量包括调整评价算法调试代价变量;所述结合所述隐私文本语义离散映射表征样例和所述离散映射关系网,确定辅助算法调试代价变量,包括:获得所述隐私文本语义离散映射表征样例对应的隐私...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。