一种用户隐私加密的方法技术

技术编号:26478932 阅读:29 留言:0更新日期:2020-11-25 19:23
本发明专利技术公开了一种用户隐私加密的方法,涉及计算机人工智能及自然语言处理技术领域,该方法使用已有的用户隐私数据作为自然语言处理的训练数据;设置预训练模型,并根据任务设计损失函数,损失函数采用交叉熵和crf相结合;进行模型训练,使用训练好的模型对文本进行隐私数据识别,实现在进行数据加密时,在未知的数据中对用户隐私数据的识别。本发明专利技术能够解决用户隐私加密的实现问题,识别速度快,识别精度高,不依赖人工积累的词典,高效精准的对用户隐私数据加密。

【技术实现步骤摘要】
一种用户隐私加密的方法
本专利技术涉及计算机人工智能及自然语言处理
,具体地说是一种用户隐私加密的方法。
技术介绍
用户隐私加密作为大数据时代重要的组成部分被广泛的应用数据采集,数据治理,数据分析,数据挖掘等领域上。随着数据共享和开放用户隐私问题越来越重要。现有的用户隐私加密方法只能积累用户隐私数据词库进行匹配识别,随着数据量的增大,迫切需要一种能够不依赖词典的用户隐私数据的工具。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种用户隐私加密的方法,解决用户隐私加密的实现问题,识别速度快,识别精度高,不依赖人工积累的词典,高效精准的对用户隐私数据加密。本专利技术解决其技术问题所采用的技术方案是:一种用户隐私加密的方法,使用已有的用户隐私数据作为自然语言处理的训练数据;设置预训练模型,并根据任务设计损失函数,损失函数采用交叉熵和crf相结合;进行模型训练,使用训练好的模型对文本进行隐私数据识别,实现在进行数据加密时,在未知的数据中对用户隐私数据的识别。r>本方法通过人工智本文档来自技高网...

【技术保护点】
1.一种用户隐私加密的方法,其特征在于,使用已有的用户隐私数据作为自然语言处理的训练数据;/n设置预训练模型,并根据任务设计损失函数,损失函数采用交叉熵和crf相结合;/n进行模型训练,使用训练好的模型对文本进行隐私数据识别,实现在进行数据加密时,在未知的数据中对用户隐私数据的识别。/n

【技术特征摘要】
1.一种用户隐私加密的方法,其特征在于,使用已有的用户隐私数据作为自然语言处理的训练数据;
设置预训练模型,并根据任务设计损失函数,损失函数采用交叉熵和crf相结合;
进行模型训练,使用训练好的模型对文本进行隐私数据识别,实现在进行数据加密时,在未知的数据中对用户隐私数据的识别。


2.根据权利要求1所述的一种用户隐私加密的方法,其特征在于,利用训练好的模型将未知数据中的用户隐私数据识别出来,并将所述用户隐私数据进行替换。


3.根据权利要求1所述的一种用户隐私加密的方法,其特征在于,通过人工标注和规则标注相结合的方式对训练数据进行标注。


4.根据权利要求1或2或3所述的一种用户隐私加密的方法,其特征在于,所述预训练模型选用ernie,通过调整模型参数,调用GPU资源进行模型训练生成,使模型的准确率达到设计要求。


5.根据权利要求4所述的一种用户隐私加密的方法,...

【专利技术属性】
技术研发人员:王明飞
申请(专利权)人:山东健康医疗大数据有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1