一种用于进行用户分层的语义处理方法技术

技术编号：39428548 阅读：12 留言：0更新日期：2023-11-19 16:14

本发明专利技术提供了一种用于进行用户分层的语义处理方法，包括：构建用户画像标签体系，根据聊天会话场景和业务需求搭建用户画像标签体系，所述用户画像标签体系包括若干初始标签；构建用户分层初始化模型，基于当前用户的用户对话文本确定用户的初始标签，所述初始标签对应初步分层信息；对获取的用户对话文本中的问句进行至少两次关键词筛选，根据筛选结果挖掘标签，所述标签对应三个结果，所述标签属于初始标签，或所述标签位于所述用户画像标签体系中，或所述标签作为新标签添加进入用户画像标签体系，同时新标签用于更新用户分层

全部详细技术资料下载

【技术实现步骤摘要】
一种用于进行用户分层的语义处理方法

[0001]本专利技术涉及用户分层领域，尤其涉及一种用于进行用户分层的语义处理方法
。

技术介绍

[0002]在产品迭代的过程中，用户的需求也会发生不同的变化
。
此时需要做用户分层，为不同用户提供个性化服务
。
用户分层是根据不同用户的行为特征划分成不同的用户群，进而制定不同的产品策略来满足其差异化需求，从而充分发挥每个层级用户的价值，达成产品目标
。
[0003]现有的用户分层方法，经常使用一些结构化用户特征数据，结合一定的人工或规则的方法进行用户分层的，效率低且不够全面
。
另外，在海量的聊天会话文本数据中，通常包含了较为丰富的用户信息，可以用来进行用户分层及圈选工作，以获得更为完整的用户画像特征
。
[0004]然而，鉴于文本数据非结构化属性，文本数据的挖掘难度较高，因此使用文本数据进行用户分层方法较为有限
。
现有的一些技术虽然可以一定程度上实现聊天会话文本的挖掘，但对于聊天会话中的文本信息度，缺乏较为精准的定位，加之客户的兴趣点可能会不断变化，笼统的文本数据挖掘可能导致所挖掘的用户标签缺乏时效性
。

技术实现思路

[0005]本专利技术的目的在于提供一种用于进行用户分层的语义处理方法，通过对高频问句的识别，确定圈定用户在当下最关心的话题，并结合关键词提取技术和语义模型的相似度计算，可以实现自动打标和分层，不仅可以实现更精准的定位，而且可以节省人...

【技术保护点】

【技术特征摘要】
1.
一种用于进行用户分层的语义处理方法，其特征在于，包括：构建用户画像标签体系，根据聊天会话场景和业务需求搭建用户画像标签体系，所述用户画像标签体系包括若干初始标签；构建用户分层初始化模型，基于当前用户的用户对话文本确定用户的初始标签，所述初始标签对应初步分层信息；对获取的用户对话文本中的问句进行至少两次关键词筛选，根据筛选结果挖掘标签，所述标签对应三个结果，所述标签属于初始标签，或所述标签位于所述用户画像标签体系中，或所述标签作为新标签添加进入用户画像标签体系，同时新标签用于更新用户分层
。2.
根据权利要求1所述的一种用于进行用户分层的语义处理方法，其特征在于，对用户对话文本中的问句筛选包括：构建自然语言处理算法模型，对获取的用户对话文本中提取第一关键词；构建分类算法模型，针对用户对话文本的句子，判断并提取其中的问句，同时基于提取的第一关键词，问句的匹配及相似度计算定位出高频问句；采用聚类算法对收集的高频问句进行聚类，以得到用一类簇下高频问句下的第二关键词，并基于所述第二关键词更新初始标签，以形成用户新标签，所述新标签用于更新用户分层
。3.
根据权利要求1所述的一种用于进行用户分层的语义处理方法，其特征在于，构建语义模型，对获取的关键词进行标签标定，进行相似度计算，确定筛选出的关键词的标签归属
。4.
根据权利要求1所述的一种用于进行用户分层的语义处理方法，其特征在于，构建自然语言处理算法模型具体包括：对获取到的用户对话文本进行文本清洗加工
、
分句
、
分词处理后，然后采用
keyBert
算法，并通过设定阈值
、
去停用词，自动输出信息度高的关键词
。5.
根据权利要求4所述的一种用于进行用户分层的语义处理方法，其特征在于，使用
keyBert
算法作为关键词的提取；
keyBert
算法基于
Transformer
架构的多头注意力机制，其中，多头注意力机制的的表达式为：上述表达式...

【专利技术属性】
技术研发人员：谢鹏，
申请(专利权)人：上海众调信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人