构建意图触发策略以及意图识别的方法和装置制造方法及图纸

技术编号:30971760 阅读:23 留言:0更新日期:2021-11-25 20:52
本说明书实施例提供了构建意图触发策略及进行意图识别的方法。构建意图触发策略的方法包括以下步骤。首先获取第一意图对应的总样本集,其中的单条样本包括,单个用户的特征信息,以及指示该用户是否具有该第一意图的正负样本标签。此外根据用户特征项,确定条件总集,单个条件是单个特征项与该特征项的单个取值的对应关系。通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从条件总集中选择若干个条件构成单条规则;并从当前样本集中剔除符合该单条规则的样本,从而更新当前样本集用于下次迭代,直到达到预设的停止条件。此时,基于生成的若干条规则,形成针对第一意图的触发策略。对第一意图的触发策略。对第一意图的触发策略。

【技术实现步骤摘要】
构建意图触发策略以及意图识别的方法和装置


[0001]本说明书一个或多个实施例涉及机器学习领域,尤其涉及构建意图触发策略,以及进行意图识别的方法和对应的装置。

技术介绍

[0002]在机器学习领域,针对用户进行针对性推荐已得到广泛的研究。特别是在用户进入应用首页时,如何在应用提供的众多服务中,让用户更加便捷、快速地找到所需服务,缩短需求满足路径,从而提升用户体验,成为研究的目标。尽管存在一些基于深度学习的推荐模型可以基于用户特征直接确定出推荐内容,然而,这样的神经网络模型一般算法复杂,可解释性不佳。
[0003]因此,希望能有改进的方案,更好地辅助进行内容推荐,从而便捷用户,提高用户体验。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种构建意图触发策略以及进行意图识别的方法和装置,可以自动化、高效地生成具有可解释性的触发策略,从而精准识别用户即刻的需求。
[0005]根据第一方面,提供了一种构建意图触发策略的方法,包括:
[0006]获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签;
[0007]根据所述多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系;
[0008]通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从所述条件总集中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代,直到达到预设的第一停止条件;
[0009]基于所述若干条规则,形成针对所述第一意图的触发策略。
[0010]根据一种可能的实施方式,获取第一意图对应的第一样本集,可以包括:获取原始数据集,其中包括用于记录多个用户的历史行为的多条数据记录,单条数据记录包括,历史推荐意图以及用户对该历史推荐意图是否接受的历史标记;从所述原始数据集中筛选出所述历史推荐意图为所述第一意图的第一数据记录;根据所述第一数据记录中的历史标记,确定对应的样本标签;基于添加有所述样本标签的第一数据记录,形成所述第一样本集。
[0011]在一个实施例中,上述多个特征项包括类别型的第一特征项,该第一特征项具有m种类别取值;所述确定条件总集,包括:将该第一特征项与其对应的m种类别取值分别组合,得到m个条件,归入所述条件总集。
[0012]在一个实施例中,上述多个特征项包括连续数值型的第二特征项;所述确定条件总集,包括:将该第二特征项的可能取值范围划分为n个范围区间作为n个范围取值;将该第
二特征项与该n个范围取值分别组合,得到n个条件,归入所述条件总集。
[0013]根据一种实施方式,上述第一停止条件包括,满足以下之一:所述第一迭代的执行次数达到次数阈值;所述当前样本集中的正样本数量或比例达到对应的预设阈值。
[0014]根据一种实施方式,形成单条规则的过程可以包括:
[0015]执行若干次第二迭代,单次第二迭代用于至少根据所述当前样本集中的正样本,选择一个条件,添加到已选中条件集中;
[0016]在达到预设的第二停止条件时,将已选中条件集中的条件的组合形成所述单条规则。
[0017]在上述实施方式的一个实施例中,第二停止条件可以包括满足以下之一:所述已选中条件集中的条件数目达到第一数目阈值;所述第一样本集中,满足所述已选中条件集中所有条件的正样本数目小于第二数目阈值。
[0018]进一步的,在上述实施方式的一个实施例中,单次第二迭代包括:确定备选条件集;至少基于各个备选规则针对所述当前样本集中的正样本的命中信息,评估各个备选规则的得分;其中,所述各个备选规则是将备选条件集中的各个备选条件分别添加到已选中条件集中得到的;选择得分最优的备选规则对应的备选条件,添加到已选中条件集中。
[0019]在一个例子中,确定备选条件集,具体包括:通过剔除操作,得到剩余条件集,所述剔除操作包括,从所述条件总集中剔除所述已选中条件集;或者,确定所述已选中条件集中涉及的已选中特征项,从所述条件总集中剔除涉及所述已选中特征项的条件;基于剩余条件集,得到所述备选条件集。
[0020]进一步的,基于剩余条件集,得到所述备选条件集可以具体包括:确定所述已选中条件集对应的既有规则的全局准确率作为既有准确率,所述全局准确率是针对所述第一样本集的正样本命中准确率;将所述剩余条件集中的各个条件分别添加到所述已选中条件集中,生成各个假定规则;确定各个假定规则的全局准确率,得到各个假定准确率;将假定准确率相对于所述既有准确率的提升超过预定阈值的若干条件,构成所述备选条件集。
[0021]在一个实施例中,上述各个备选规则包括第一备选规则;评估各个备选规则的得分,具体包括:确定所述第一备选规则的全局准确率作为第一准确率,所述全局准确率是针对所述第一样本集的正样本命中准确率;确定所述第一备选规则的局部召回率作为第一召回率,所述局部召回率是针对所述当前样本集的正样本召回率;根据所述第一准确率和所述第一召回率,确定所述第一备选规则的得分。
[0022]进一步的,在一个示例中,确定所述第一备选规则的得分,包括:根据所述第一准确率,所述第一召回率,以及第一权重参数,确定所述第一备选规则的得分。
[0023]在另一示例中,确定所述第一备选规则的得分,包括:获取所述已选中条件集对应的既有规则的全局准确率作为既有准确率,以及该既有规则的局部召回率作为既有召回率;确定所述第一准确率相对于所述既有准确率的第一比例,以及所述第一召回率相对于所述既有召回率的第二比例;根据所述第一比例,所述第二比例以及第二权重参数,计算所述第一备选规则的得分。
[0024]更进一步的,在一个具体例子中,可以以所述第二比例为底数,以第一中间量为指数,计算得到所述第一备选规则的得分,所述第一中间量与所述第一比例正相关,与所述第二权重参数负相关。
[0025]根据一种可能的实施方式,上述基于所述若干条规则,形成针对所述第一意图的触发策略,可以包括:判断所述若干条规则中的各条规则是否满足接受条件,将满足接受条件的规则归入所述触发策略;所述接受条件为,同时满足以下子条件:
[0026]针对所述第一样本集的正样本命中准确率达到第一比例阈值;
[0027]针对所述第一样本集的正样本命中数量达到第二数目阈值;
[0028]规则所包含的条件数目在预设区间。
[0029]根据第二方面,提供了一种意图识别方法,包括:
[0030]获取目标用户的对应于多个特征项的特征信息;
[0031]将所述特征信息与预先构建的策略集中的各条规则进行匹配,从而识别出目标意图,其中,所述策略集包括针对多个意图中的每个意图,根据第一方面的方法形成的触发策略;
[0032]根据所述目标意图,向所述目标用户展示该目标意图下的内容信息。
[0033]根据第三方面,提供了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建意图触发策略的方法,包括:获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签;根据所述多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系;通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从所述条件总集中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代,直到达到预设的第一停止条件;基于所述若干条规则,形成针对所述第一意图的触发策略。2.根据权利要求1所述的方法,其中,获取第一意图对应的第一样本集,包括:获取原始数据集,其中包括用于记录多个用户的历史行为的多条数据记录,单条数据记录包括,历史推荐意图以及用户对该历史推荐意图是否接受的历史标记;从所述原始数据集中筛选出所述历史推荐意图为所述第一意图的第一数据记录;根据所述第一数据记录中的历史标记,确定对应的样本标签;基于添加有所述样本标签的第一数据记录,形成所述第一样本集。3.根据权利要求1所述的方法,其中,所述多个特征项包括类别型的第一特征项,该第一特征项具有m种类别取值;所述确定条件总集,包括:将该第一特征项与其对应的m种类别取值分别组合,得到m个条件,归入所述条件总集。4.根据权利要求1所述的方法,其中,所述多个特征项包括连续数值型的第二特征项;所述确定条件总集,包括:将该第二特征项的可能取值范围划分为n个范围区间作为n个范围取值;将该第二特征项与该n个范围取值分别组合,得到n个条件,归入所述条件总集。5.根据权利要求1所述的方法,其中,所述第一停止条件包括,满足以下之一:所述第一迭代的执行次数达到次数阈值;所述当前样本集中的正样本数量或比例达到对应的预设阈值。6.根据权利要求1所述的方法,其中,基于当前样本集,从所述条件总集中选择若干个条件构成单条规则,包括:执行若干次第二迭代,单次第二迭代用于至少根据所述当前样本集中的正样本,选择一个条件,添加到已选中条件集中;在达到预设的第二停止条件时,将已选中条件集中的条件的组合形成所述单条规则。7.根据权利要求6所述的方法,其中,所述第二停止条件包括,满足以下之一:所述已选中条件集中的条件数目达到第一数目阈值;所述第一样本集中,满足所述已选中条件集中所有条件的正样本数目小于第二数目阈值。8.根据权利要求6所述的方法,其中,所述单次第二迭代包括:确定备选条件集;至少基于各个备选规则针对所述当前样本集中的正样本的命中信息,评估各个备选规则的得分;其中,所述各个备选规则是将备选条件集中的各个备选条件分别添加到已选中条件集中得到的;选择得分最优的备选规则对应的备选条件,添加到已选中条件集中。
9.根据权利要求8所述的方法,其中,确定备选条件集,包括:通过剔除操作,得到剩余条件集,所述剔除操作包括,从所述条件总集中剔除所述已选中条件集;或者,确定所述已选中条件集中涉及的已选中特征项,从所述条件总集中剔除涉及所述已选中特征项的条件;基于剩余条件集,得到所述备选条件集。10.根据权利要求9所述的方法,其中,基于剩余条件集,得到所述备选条件集,包括:确定所述已选中条件集对应的既有规则的全局准确率作为既有准确率,所述全局准确率是针对所述第一样本集的正样本命中准确率;将所述剩余条件集中的各个条件分别添加到所述已选中条件集中,生成各个假定规则;确定各个假定规则的全局准确率,得到各个假定准确率;将假定准确率相对于所述既有准确率的提升超过预定阈值的若干条件,构成所述备选条件集。11.根据权利要求8所述的方法,其中,所述各个备选规则包括第一备选规则,评估各个备选规则的得分,包括:确定所述第一备选规则的全局准确率作为...

【专利技术属性】
技术研发人员:李有儒梁仕威陈少虎沈开明娄寅钟文亮
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1