用户画像的构建方法、基于用户画像的对话方法及装置制造方法及图纸

技术编号：27284446 阅读：17 留言：0更新日期：2021-02-06 11:52

本申请公开了一种用户画像的构建方法、基于用户画像的对话方法及装置，涉及机器人问答领域。该方法包括：获取用户帐号的历史对话数据；对历史对话数据进行特征提取，得到历史对话特征；对历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到用户帐号对应的至少两个维度的用户标签，用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；根据至少两个维度的用户标签构建用户画像。通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签，基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像。而构建准确且全面的用户画像。而构建准确且全面的用户画像。

全部详细技术资料下载

【技术实现步骤摘要】
用户画像的构建方法、基于用户画像的对话方法及装置

[0001]本申请涉及机器人问答领域，特别涉及一种用户画像的构建方法、基于用户画像的对话方法及装置。

技术介绍

[0002]用户画像(Persona)是指一种用于勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像是真实用户的虚拟代表，智能设备通过用户画像可针对性地与用户进行对话。
[0003]相关技术中，用户画像是通过用户帐号对应的基本信息进行构建的。比如，用户在第一次使用应用程序时，需要注册用户帐号，在注册用户帐号的过程中，用户会填写一些个人信息(如性别、星座、生日、兴趣等)。在一些情况下，用户在注册用户帐号时为了节约时间或避免隐私泄露，不会填写完整信息。
[0004]通过上述技术方案构建的用户画像，由于个人信息的缺失，易于造成构建的用户画像不够准确，或用户画像的维度无法涵盖各个方面，使得智能设备无法根据用户画像准确应答用户。

技术实现思路

[0005]本申请实施例提供了一种用户画像的构建方法、基于用户画像的对话方法及装置，通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签，构建较为准确且全面的用户画像。所述技术方案如下：
[0006]根据本申请的一方面，提供了一种用户画像的构建方法，所述方法包括：
[0007]获取用户帐号的历史对话数据；
[0008]对所述历史对话数据进行特征提取，得到历史对话特征；
[0009]对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到所述用户帐...

【技术保护点】

【技术特征摘要】
1.一种用户画像的构建方法，其特征在于，所述方法包括：获取用户帐号的历史对话数据；对所述历史对话数据进行特征提取，得到历史对话特征；对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到所述用户帐号对应的至少两个维度的用户标签，所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；根据所述至少两个维度的用户标签构建所述用户画像。2.根据权利要求1所述的方法，其特征在于，所述对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到所述用户帐号对应的至少两个维度的用户标签，包括：调用多维度标签分类器对所述历史对话特征和所述用户帐号对应的用户信息进行所述分类处理，输出所述用户帐号对应的至少两个维度的用户标签。3.根据权利要求2所述的方法，其特征在于，所述多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器，n为正整数；所述调用多维度标签分类器对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，输出所述用户帐号对应的至少两个维度的用户标签，包括：将所述历史对话特征和所述用户帐号对应的用户信息数输入至所述n个标签分类器中，输出所述用户帐号在所述n个维度上的标签预测概率；根据所述标签预测概率得到所述用户帐号在所述n个维度上的用户标签。4.根据权利要求3所述的方法，其特征在于，所述根据所述标签预测概率得到所述用户帐号在所述n个维度上的用户标签，包括：将所述n个维度上的标签预测概率按照由大到小的规则进行排序；根据排序结果从所述n个维度上的用户标签中选择前k个用户标签；将所述前k个用户标签作为所述用户帐号在所述k个维度上的用户标签输出，k≤n，且k为正整数。5.根据权利要求1至4任一所述的方法，其特征在于，所述对所述历史对话数据进行特征提取，得到历史对话特征，包括：调用预训练语言模型GPT-2对所述历史对话数据进行处理，输出所述历史对话数据对应的历史对话特征。6.根据权利要求1至4任一所述的方法，其特征在于，所述根据所述至少两个维度的用户标签构建用户画像，还包括：获取所述用户帐号提供的索引信息；根据所述索引信息获取所述用户帐号对应的浏览信息；根据所述浏览信息和所述至少两个维度的用户标签构建所述用户画像；或，获取所述用户帐号对应的兴趣信息；根据所述兴趣信息和所述至少两个维度的用户标签构建所述用户画像；或，获取所述用户帐号对应的社交动态信息；根据所述社交动态信息和所述至少两个维度的用户标签构建所述用户画像。7.根据权利要求2至4任一所述的方法，其特征在于，所述多维度标签分类器是通过如
下方式训练得到的：获取至少一个用户帐号对应的样本历史对话数据，所述样本历史对话数据对应有所述至少两个维度的真实用户标签；从所述样本历史对话数据中提取样本历史对话特征；将所述样本历史对话特征和所述用户帐号对应的用户信息输入至所述多维度标签分类器中，输出所述用户帐号对应的至少两个维度的预测用户标签；根据所述真实用户标签和所述预测用户标签对所述多维度标签分类器进行训练，得到训练后的多维度标签分类器。8.根据权利要求7所述的方法，其特征在于，所述多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器，n为正整数；所述根据所述真实用户标签和所述预测用户标签对所述多维...

【专利技术属性】
技术研发人员：陆笛，周霄，周杰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人