用户分群方法、装置、设备及存储介质制造方法及图纸

技术编号:29462403 阅读:14 留言:0更新日期:2021-07-27 17:33
本发明专利技术涉及大数据领域,公开了一种用户分群方法、装置、设备及存储介质。该方法包括:获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据;提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵;采用预置矩阵分解方法,对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵;根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组。本发明专利技术通过分析用户意图,大大提高了用户分群的准确率。

User clustering method, device, equipment and storage medium

【技术实现步骤摘要】
用户分群方法、装置、设备及存储介质
本专利技术涉及大数据领域,尤其涉及一种用户分群方法、装置、设备及存储介质。
技术介绍
随着计算机技术的高速发展,利用机器人与用户进行沟通并处理用户需求的效率十分高而且能节省较大的人工成本。用户可以通过对移动终端的操作可以展示出用户的行为偏好。根据用户的行为偏好对用户群体进行划分,对同一个群体中的用户推送相似的信息,或利用相似用户来向目标用户推送信息,可以准确地向用户推送个性化内容。现有的用户分群方法多基于用户的行为特征以及兴趣爱好来对用户进行分群。这种方法仅考虑到了用户自身的特征,导致其分群结果往往仅适用于特定的应用场景,可移植性较差。因此,现有用户分群技术的准确率较低,难以令人满意。
技术实现思路
本专利技术的主要目的在于解决目前用户分群的准确率低的技术问题。本专利技术第一方面提供了一种用户分群方法,包括:获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据;提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵;对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵;根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组。可选的,在本专利技术第一方面的第一种实现方式中,所述获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据包括:获取多个业务环节中各用户的人机交互语音数据;对所述人机交互语音数据进行语音识别和文本转换,得到语音文本数据;对所述语音文本数据进行语义分析和分类,得到用户意图数据。可选的,在本专利技术第一方面的第二种实现方式中,所述提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵包括:提取所述用户意图数据中的每一个人机交互技能点对应的词汇;分别对所述词汇进行词向量转换,得到多个词向量;基于预置用户意图信息库,分别对所述词向量进行上下文分析,得到多个用户意图;对所述各用户意图进行编码,得到用户意图矩阵。可选的,在本专利技术第一方面的第三种实现方式中,所述对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵包括:计算所述用户意图矩阵的基矩阵,并根据所述基矩阵,计算所述用户意图矩阵的系数矩阵;对所述基矩阵和所述系数矩阵进行交替迭代,得到意图特征矩阵。可选的,在本专利技术第一方面的第四种实现方式中,所述对所述基矩阵和所述系数矩阵进行交替迭代,得到意图特征矩阵包括:分别对所述基矩阵和所述系数矩阵进行初始化,得到初始基矩阵和初始系数矩阵;对所述初始基矩阵和所述初始系数矩阵进行迭代计算,得到更新基矩阵;调用预置损失函数,计算当前更新基矩阵和所述初始基矩阵的损失值,直至所述损失值小于预置损失阈值时,将当前更新基矩阵作为意图特征矩阵。可选的,在本专利技术第一方面的第五种实现方式中,所述根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组包括:提取所述意图特征矩阵中的列向量,得到多个列向量;分别对所述各列向量进行特征值计算,得到所述各列向量对应的多个特征值;分别提取所述各列向量对应的多个特征值中的最大值,并将所述最大值作为对应列向量的有效用户分群,得到多个用户群组。可选的,在本专利技术第一方面的第六种实现方式中,在所述根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组之后,还包括:对所述各用户进行标签标注,得到多个用户标签;根据所述各用户群组,对所述各用户标签进行聚类,得到所述各用户群组对应的用户标签集;根据所述各用户群组对应的用户标签集绘制用户特征分布,得到用户群组画像。本专利技术第二方面提供了一种用户分群装置,所述用户分群装置包括:获取模块,用于获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据;编码模块,用于提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵;矩阵分解模块,用于对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵;用户分群模块,用于根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组。可选的,在本专利技术第二方面的第一种实现方式中,所述获取模块具体用于:获取多个业务环节中各用户的人机交互语音数据;对所述人机交互语音数据进行语音识别和文本转换,得到语音文本数据;对所述语音文本数据进行语义分析和分类,得到用户意图数据。可选的,在本专利技术第二方面的第二种实现方式中,所述编码模块具体用于:提取所述用户意图数据中的每一个人机交互技能点对应的词汇;分别对所述词汇进行词向量转换,得到多个词向量;基于预置用户意图信息库,分别对所述词向量进行上下文分析,得到多个用户意图;对所述各用户意图进行编码,得到用户意图矩阵。可选的,在本专利技术第二方面的第三种实现方式中,所述矩阵分解模块还包括:矩阵计算单元,用于计算所述用户意图矩阵的基矩阵,并根据所述基矩阵,计算所述用户意图矩阵的系数矩阵;交替计算单元,用于对所述基矩阵和所述系数矩阵进行交替迭代,得到意图特征矩阵。可选的,在本专利技术第二方面的第四种实现方式中,所述交替计算单元具体用于:分别对所述基矩阵和所述系数矩阵进行初始化,得到初始基矩阵和初始系数矩阵;对所述初始基矩阵和所述初始系数矩阵进行迭代计算,得到更新基矩阵;调用预置损失函数,计算当前更新基矩阵和所述初始基矩阵的损失值,直至所述损失值小于预置损失阈值时,将当前更新基矩阵作为意图特征矩阵。可选的,在本专利技术第二方面的第五种实现方式中,所述用户分群模块具体用于:提取所述意图特征矩阵中的列向量,得到多个列向量;分别对所述各列向量进行特征值计算,得到所述各列向量对应的多个特征值;分别提取所述各列向量对应的多个特征值中的最大值,并将所述最大值作为对应列向量的有效用户分群,得到多个用户群组。可选的,在本专利技术第二方面的第六种实现方式中,所述用户分群装置还包括:画像生成模块,用于对所述各用户进行标签标注,得到多个用户标签;根据所述各用户群组,对所述各用户标签进行聚类,得到所述各用户群组对应的用户标签集;根据所述各用户群组对应的用户标签集绘制用户特征分布,得到用户群组画像。本专利技术第三方面提供了一种用户分群设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户分群设备执行上述的用户分群方法。本专利技术的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运本文档来自技高网...

【技术保护点】
1.一种用户分群方法,其特征在于,所述用户分群方法包括:/n获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据;/n提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵;/n对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵;/n根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组。/n

【技术特征摘要】
1.一种用户分群方法,其特征在于,所述用户分群方法包括:
获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据;
提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵;
对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵;
根据所述意图特征矩阵,对所述各用户进行分群,得到多个用户群组。


2.根据权利要求1所述的用户分群方法,其特征在于,所述获取多个业务环节中各用户的人机交互语音数据,并对所述人机交互语音数据进行预处理,得到用户意图数据包括:
获取多个业务环节中各用户的人机交互语音数据;
对所述人机交互语音数据进行语音识别和文本转换,得到语音文本数据;
对所述语音文本数据进行语义分析和分类,得到用户意图数据。


3.根据权利要求2所述的用户分群方法,其特征在于,所述提取所述用户意图数据中每一个人机交互技能点对应的用户意图,得到多个用户意图,并对所述各用户意图进行编码,得到用户意图矩阵包括:
提取所述用户意图数据中的每一个人机交互技能点对应的词汇;
分别对所述词汇进行词向量转换,得到多个词向量;
基于预置用户意图信息库,分别对所述词向量进行上下文分析,得到多个用户意图;
对所述各用户意图进行编码,得到用户意图矩阵。


4.根据权利要求1所述的用户分群方法,其特征在于,所述对所述用户意图矩阵进行矩阵分解,得到意图特征矩阵包括:
计算所述用户意图矩阵的基矩阵,并根据所述基矩阵,计算所述用户意图矩阵的系数矩阵;
对所述基矩阵和所述系数矩阵进行交替迭代,得到意图特征矩阵。


5.根据权利要求4所述的用户分群方法,其特征在于,所述对所述基矩阵和所述系数矩阵进行交替迭代,得到意图特征矩阵包括:
分别对所述基矩阵和所述系数矩阵进行初始化,得到初始基矩阵和初始系数矩阵;
对所述初始基矩阵和所述初始系数矩阵进行迭代计算,得到更新基矩阵;
调用预置损失函数...

【专利技术属性】
技术研发人员:倪子凡王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1