基于人工智能的用户身份识别方法、装置、终端及介质制造方法及图纸

技术编号：26482243 阅读：22 留言：0更新日期：2020-11-25 19:28

本发明专利技术涉及人工智能，提供一种基于人工智能的用户身份识别方法、装置、终端及介质，包括：将多个用户的埋点序列编码为第一文本序列；对每个埋点序列中的多个埋点时间戳进行分箱处理得到多个时间令牌；根据第一文本序列及对应的多个时间令牌得到第二文本序列并切分为多个文本语句；根据业务分层模型对多个用户进行分层，并从同一层的用户中任意选取两个不同用户的两个文本语句构建负样本，从同一个用户的多个文本语句中随机选取两个文本语句构建正样本；基于负样本及正样本对BERT预训练模型进行参数微调得到用户身份识别模型；使用用户身份识别模型识别目标用户的目标文本序列，得到目标用户的身份。本发明专利技术能够基于埋点数据识别用户的身份。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的用户身份识别方法、装置、终端及介质
本专利技术涉及人工智能
，尤其涉及一种基于人工智能的用户身份识别方法、装置、终端及介质。
技术介绍
在保险及金融领域的一些APP的使用场景中，存在冒用他人的终端、账号或身份进行APP操作进而形成欺诈的风险。比如在寿险的增员场景中，有些准增员在自己不能参加活动的情况下会让其他人代替参加活动并登陆账号进行操作。同一APP账号下的多人操作会存在虚假增员、虚假人力以及骗佣、套佣等欺诈的风险。同样在其它的一些金融类APP，比如手机银行、第三方支付等APP中，同样有需要甄别用户身份唯一性的需求。因此，有必要提供一种能够识别应用点击行为中的身份的唯一性的方案。
技术实现思路
鉴于以上内容，有必要提供一种基于人工智能的用户身份识别方法、装置、终端及介质，能够基于埋点数据识别用户的身份。本专利技术的第一方面提供一种基于人工智能的用户身份识别方法，所述方法包括：获取多个用户的埋点序列，并将每个埋点序列编码为第一文本序列；对每个埋点序列中的...

【技术保护点】
1.一种基于人工智能的用户身份识别方法，其特征在于，所述方法包括：/n获取多个用户的埋点序列，并将每个埋点序列编码为第一文本序列；/n对每个埋点序列中的多个埋点时间戳进行分箱处理得到多个时间令牌；/n根据所述第一文本序列及对应的所述多个时间令牌得到第二文本序列，并将所述第二文本序列切分为多个文本语句；/n根据业务分层模型对所述多个用户进行分层，并从同一层的用户中任意选取两个不同用户的两个文本语句构建负样本，从同一个用户的多个文本语句中随机选取两个文本语句构建正样本；/n基于所述负样本及所述正样本对BERT预训练模型进行参数微调得到用户身份识别模型；/n使用所述用户身份识别模型识别目标用户的目标...

【技术特征摘要】
1.一种基于人工智能的用户身份识别方法，其特征在于，所述方法包括：
获取多个用户的埋点序列，并将每个埋点序列编码为第一文本序列；
对每个埋点序列中的多个埋点时间戳进行分箱处理得到多个时间令牌；
根据所述第一文本序列及对应的所述多个时间令牌得到第二文本序列，并将所述第二文本序列切分为多个文本语句；
根据业务分层模型对所述多个用户进行分层，并从同一层的用户中任意选取两个不同用户的两个文本语句构建负样本，从同一个用户的多个文本语句中随机选取两个文本语句构建正样本；
基于所述负样本及所述正样本对BERT预训练模型进行参数微调得到用户身份识别模型；
使用所述用户身份识别模型识别目标用户的目标文本序列，得到所述目标用户的身份。

2.如权利要求1所述的基于人工智能的用户身份识别方法，其特征在于，所述获取多个用户的埋点序列包括：
针对每一个用户，按照时间顺序获取所述用户的多个埋点数据；
获取所述多个埋点数据中相同埋点数据对应的多个埋点时间戳；
判断所述多个埋点时间戳中每两个相邻的埋点时间戳之间的时间差值是否小于预设时间差阈值；
当确定任意两个相邻的埋点时间戳之间的时间差值小于所述预设时间差阈值时，将所述任意两个相邻的埋点时间戳对应的埋点数据合并为一个埋点数据；
根据合并后的埋点数据得到所述用户的埋点序列。

3.如权利要求1所述的基于人工智能的用户身份识别方法，其特征在于，所述将每个埋点序列编码为第一文本序列包括：
获取所述埋点序列中的每个埋点数据中的每个字符；
根据预设字符与文本之间的对应关系，将所述埋点序列中的每个埋点数据中的每个字符替换为对应的文本，得到文本序列。

4.如权利要求1所述的基于人工智能的用户身份识别方法，其特征在于，所述对每个埋点序列中的多个埋点时间戳进行分箱处理得到多个时间令牌包括：
将每两个相邻的埋点时间戳之间的时间间隔进行第一分箱处理得到第一时间令牌；
将每个埋点时间戳按照预设时间节点进行第二分箱处理得到第二时间令牌；
计算每个埋点时间戳与预设参考时间戳的时间间隔得到第三时间令牌。

5.如权利要求4所述的基于人工智能的用户身份识别方法，其特征在于，所述根据所述第一文本序列及对应的所述多个时间令牌得到第二文本序列包括：
将每个埋点时间戳对应的第一时间令牌、第二时间令牌及第三时间令牌进行...

【专利技术属性】
技术研发人员：张跃，张浩然，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人