用户画像的构建方法、基于用户画像的对话方法及装置制造方法及图纸

技术编号:27284446 阅读:17 留言:0更新日期:2021-02-06 11:52
本申请公开了一种用户画像的构建方法、基于用户画像的对话方法及装置,涉及机器人问答领域。该方法包括:获取用户帐号的历史对话数据;对历史对话数据进行特征提取,得到历史对话特征;对历史对话特征和所述用户帐号对应的用户信息进行分类处理,得到用户帐号对应的至少两个维度的用户标签,用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类;根据至少两个维度的用户标签构建用户画像。通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签,基于正确的语义意图下能够获取到准确且全面的用户标签,从而构建准确且全面的用户画像。而构建准确且全面的用户画像。而构建准确且全面的用户画像。

【技术实现步骤摘要】
用户画像的构建方法、基于用户画像的对话方法及装置


[0001]本申请涉及机器人问答领域,特别涉及一种用户画像的构建方法、基于用户画像的对话方法及装置。

技术介绍

[0002]用户画像(Persona)是指一种用于勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像是真实用户的虚拟代表,智能设备通过用户画像可针对性地与用户进行对话。
[0003]相关技术中,用户画像是通过用户帐号对应的基本信息进行构建的。比如,用户在第一次使用应用程序时,需要注册用户帐号,在注册用户帐号的过程中,用户会填写一些个人信息(如性别、星座、生日、兴趣等)。在一些情况下,用户在注册用户帐号时为了节约时间或避免隐私泄露,不会填写完整信息。
[0004]通过上述技术方案构建的用户画像,由于个人信息的缺失,易于造成构建的用户画像不够准确,或用户画像的维度无法涵盖各个方面,使得智能设备无法根据用户画像准确应答用户。

技术实现思路

[0005]本申请实施例提供了一种用户画像的构建方法、基于用户画像的对话方法及装置,通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签,构建较为准确且全面的用户画像。所述技术方案如下:
[0006]根据本申请的一方面,提供了一种用户画像的构建方法,所述方法包括:
[0007]获取用户帐号的历史对话数据;
[0008]对所述历史对话数据进行特征提取,得到历史对话特征;
[0009]对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理,得到所述用户帐号对应的至少两个维度的用户标签,所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类;
[0010]根据所述至少两个维度的用户标签构建所述用户画像。
[0011]根据本申请的另一方面,提供了一种基于用户画像的对话方法,所述方法包括:
[0012]获取正在进行对话的用户帐号;
[0013]获取所述用户帐号对应的用户画像,所述用户画像包括至少两个维度的用户标签,所述用户标签是根据历史对话特征和所述用户帐号对应的用户信息生成的,所述历史对话特征是从所述用户帐号的历史对话数据中提取的;
[0014]根据所述用户画像获取所述用户帐号对应的对话主题兴趣列表,所述对话主题兴趣列表包括至少一个对话主题;
[0015]根据所述对话主题兴趣列表输出应答语句。
[0016]根据本申请的另一方面,提供了一种用户画像的构建装置,所述装置包括:
[0017]第一获取模块,用于获取用户帐号的历史对话数据;
[0018]特征提取模块,用于对所述历史对话数据进行特征提取,得到历史对话特征;
[0019]分类模块,用于对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理,得到所述用户帐号对应的至少两个维度的用户标签,所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类;
[0020]所述构建模块,用于根据所述至少两个维度的用户标签构建所述用户画像。
[0021]根据本申请的另一方面,提供了一种基于用户画像的对话装置,所述装置包括:
[0022]第二获取模块,用于获取正在进行对话的用户帐号;
[0023]所述第二获取模块,用于根据所述用户帐号获取所述用户帐号对应的用户画像,所述用户画像包括至少两个维度的用户标签,所述用户标签是对历史对话特征和所述用户帐号对应的用户信息进行分类处理后得到的,所述历史对话特征是从所述用户帐号的历史对话数据中提取的;
[0024]所述第二获取模块,用于获取所述用户帐号对应的对话主题兴趣列表,所述对话主题兴趣列表包括至少一个对话主题;
[0025]输出模块,用于根据所述对话主题兴趣列表输出应答语句。
[0026]根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的用户画像的构建方法和基于用户画像的对话方法。
[0027]根据本申请的另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的用户画像的构建方法和基于用户画像的对话方法。
[0028]根据本申请的另一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行如上方面所述的用户画像的构建方法和基于用户画像的对话方法。
[0029]本申请实施例提供的技术方案带来的有益效果至少包括:
[0030]通过对获取到的用户帐号对应的历史数据进行分类处理,得到至少两个维度的用户标签,利用上下文关系准确地理解用户的语义意图,使得基于正确的语义意图下能够获取到准确且全面的用户标签,从而构建准确且全面的用户画像,使得终端能够根据用户画像与用户智能地进行对话。
附图说明
[0031]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本申请一个示例性实施例提供的计算机系统的框架图;
[0033]图2是本申请一个示例性实施例提供的用户画像的构建方法的流程图;
[0034]图3是本申请另一个示例性实施例提供的用户画像的构建方法的流程图;
[0035]图4是本申请一个示例性实施例提供的用户画像的构建和使用流程的框架图;
[0036]图5是本申请一个示例性实施例提供的用户标签的体系框架图;
[0037]图6是本申请一个示例性实施例提供的GPT-2模型的结构框架示意图;
[0038]图7是本申请一个示例性实施例提供的用户标签分类的流程框架图;
[0039]图8是本申请一个示例性实施例提供的多维度标签分类器的训练方法的流程图;
[0040]图9是本申请一个示例性实施例提供的基于用户画像的对话方法的流程图;
[0041]图10是本申请一个示例性实施例提供的用户画像的构建装置的结构框图;
[0042]图11是本申请一个示例性实施例提供的基于用户画像的对话装置的结构框图;
[0043]图12是本申请一个示例性实施例提供的服务器的装置结构示意图。
具体实施方式
[0044]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像的构建方法,其特征在于,所述方法包括:获取用户帐号的历史对话数据;对所述历史对话数据进行特征提取,得到历史对话特征;对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理,得到所述用户帐号对应的至少两个维度的用户标签,所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类;根据所述至少两个维度的用户标签构建所述用户画像。2.根据权利要求1所述的方法,其特征在于,所述对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理,得到所述用户帐号对应的至少两个维度的用户标签,包括:调用多维度标签分类器对所述历史对话特征和所述用户帐号对应的用户信息进行所述分类处理,输出所述用户帐号对应的至少两个维度的用户标签。3.根据权利要求2所述的方法,其特征在于,所述多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器,n为正整数;所述调用多维度标签分类器对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理,输出所述用户帐号对应的至少两个维度的用户标签,包括:将所述历史对话特征和所述用户帐号对应的用户信息数输入至所述n个标签分类器中,输出所述用户帐号在所述n个维度上的标签预测概率;根据所述标签预测概率得到所述用户帐号在所述n个维度上的用户标签。4.根据权利要求3所述的方法,其特征在于,所述根据所述标签预测概率得到所述用户帐号在所述n个维度上的用户标签,包括:将所述n个维度上的标签预测概率按照由大到小的规则进行排序;根据排序结果从所述n个维度上的用户标签中选择前k个用户标签;将所述前k个用户标签作为所述用户帐号在所述k个维度上的用户标签输出,k≤n,且k为正整数。5.根据权利要求1至4任一所述的方法,其特征在于,所述对所述历史对话数据进行特征提取,得到历史对话特征,包括:调用预训练语言模型GPT-2对所述历史对话数据进行处理,输出所述历史对话数据对应的历史对话特征。6.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述至少两个维度的用户标签构建用户画像,还包括:获取所述用户帐号提供的索引信息;根据所述索引信息获取所述用户帐号对应的浏览信息;根据所述浏览信息和所述至少两个维度的用户标签构建所述用户画像;或,获取所述用户帐号对应的兴趣信息;根据所述兴趣信息和所述至少两个维度的用户标签构建所述用户画像;或,获取所述用户帐号对应的社交动态信息;根据所述社交动态信息和所述至少两个维度的用户标签构建所述用户画像。7.根据权利要求2至4任一所述的方法,其特征在于,所述多维度标签分类器是通过如
下方式训练得到的:获取至少一个用户帐号对应的样本历史对话数据,所述样本历史对话数据对应有所述至少两个维度的真实用户标签;从所述样本历史对话数据中提取样本历史对话特征;将所述样本历史对话特征和所述用户帐号对应的用户信息输入至所述多维度标签分类器中,输出所述用户帐号对应的至少两个维度的预测用户标签;根据所述真实用户标签和所述预测用户标签对所述多维度标签分类器进行训练,得到训练后的多维度标签分类器。8.根据权利要求7所述的方法,其特征在于,所述多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器,n为正整数;所述根据所述真实用户标签和所述预测用户标签对所述多维...

【专利技术属性】
技术研发人员:陆笛周霄周杰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1