构建意图触发策略以及意图识别的方法和装置制造方法及图纸

技术编号：30971760 阅读：23 留言：0更新日期：2021-11-25 20:52

本说明书实施例提供了构建意图触发策略及进行意图识别的方法。构建意图触发策略的方法包括以下步骤。首先获取第一意图对应的总样本集，其中的单条样本包括，单个用户的特征信息，以及指示该用户是否具有该第一意图的正负样本标签。此外根据用户特征项，确定条件总集，单个条件是单个特征项与该特征项的单个取值的对应关系。通过若干次第一迭代生成若干条规则，其中单次第一迭代包括：基于当前样本集，从条件总集中选择若干个条件构成单条规则；并从当前样本集中剔除符合该单条规则的样本，从而更新当前样本集用于下次迭代，直到达到预设的停止条件。此时，基于生成的若干条规则，形成针对第一意图的触发策略。对第一意图的触发策略。对第一意图的触发策略。

全部详细技术资料下载

【技术实现步骤摘要】
构建意图触发策略以及意图识别的方法和装置

[0001]本说明书一个或多个实施例涉及机器学习领域，尤其涉及构建意图触发策略，以及进行意图识别的方法和对应的装置。

技术介绍

[0002]在机器学习领域，针对用户进行针对性推荐已得到广泛的研究。特别是在用户进入应用首页时，如何在应用提供的众多服务中，让用户更加便捷、快速地找到所需服务，缩短需求满足路径，从而提升用户体验，成为研究的目标。尽管存在一些基于深度学习的推荐模型可以基于用户特征直接确定出推荐内容，然而，这样的神经网络模型一般算法复杂，可解释性不佳。
[0003]因此，希望能有改进的方案，更好地辅助进行内容推荐，从而便捷用户，提高用户体验。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种构建意图触发策略以及进行意图识别的方法和装置，可以自动化、高效地生成具有可解释性的触发策略，从而精准识别用户即刻的需求。
[0005]根据第一方面，提供了一种构建意图触发策略的方法，包括：
[0006]获取第一意图对应的第一样本集，其中的单条样本包括，单个用户的对应于多个特征项的特征信息，以及指示该用户是否具有该第一意图的正负样本标签；
[0007]根据所述多个特征项，确定条件总集，其中的单个条件包括，单个特征项与该特征项的单个取值的对应关系；
[0008]通过若干次第一迭代生成若干条规则，其中单次第一迭代包括：基于当前样本集，从所述条件总集中选择若干个条件构成单条规则；从所述当前样本集中剔除符合所述单条规则的样本，...

【技术保护点】

【技术特征摘要】
1.一种构建意图触发策略的方法，包括：获取第一意图对应的第一样本集，其中的单条样本包括，单个用户的对应于多个特征项的特征信息，以及指示该用户是否具有该第一意图的正负样本标签；根据所述多个特征项，确定条件总集，其中的单个条件包括，单个特征项与该特征项的单个取值的对应关系；通过若干次第一迭代生成若干条规则，其中单次第一迭代包括：基于当前样本集，从所述条件总集中选择若干个条件构成单条规则；从所述当前样本集中剔除符合所述单条规则的样本，从而更新所述当前样本集用于下次迭代，直到达到预设的第一停止条件；基于所述若干条规则，形成针对所述第一意图的触发策略。2.根据权利要求1所述的方法，其中，获取第一意图对应的第一样本集，包括：获取原始数据集，其中包括用于记录多个用户的历史行为的多条数据记录，单条数据记录包括，历史推荐意图以及用户对该历史推荐意图是否接受的历史标记；从所述原始数据集中筛选出所述历史推荐意图为所述第一意图的第一数据记录；根据所述第一数据记录中的历史标记，确定对应的样本标签；基于添加有所述样本标签的第一数据记录，形成所述第一样本集。3.根据权利要求1所述的方法，其中，所述多个特征项包括类别型的第一特征项，该第一特征项具有m种类别取值；所述确定条件总集，包括：将该第一特征项与其对应的m种类别取值分别组合，得到m个条件，归入所述条件总集。4.根据权利要求1所述的方法，其中，所述多个特征项包括连续数值型的第二特征项；所述确定条件总集，包括：将该第二特征项的可能取值范围划分为n个范围区间作为n个范围取值；将该第二特征项与该n个范围取值分别组合，得到n个条件，归入所述条件总集。5.根据权利要求1所述的方法，其中，所述第一停止条件包括，满足以下之一：所述第一迭代的执行次数达到次数阈值；所述当前样本集中的正样本数量或比例达到对应的预设阈值。6.根据权利要求1所述的方法，其中，基于当前样本集，从所述条件总集中选择若干个条件构成单条规则，包括：执行若干次第二迭代，单次第二迭代用于至少根据所述当前样本集中的正样本，选择一个条件，添加到已选中条件集中；在达到预设的第二停止条件时，将已选中条件集中的条件的组合形成所述单条规则。7.根据权利要求6所述的方法，其中，所述第二停止条件包括，满足以下之一：所述已选中条件集中的条件数目达到第一数目阈值；所述第一样本集中，满足所述已选中条件集中所有条件的正样本数目小于第二数目阈值。8.根据权利要求6所述的方法，其中，所述单次第二迭代包括：确定备选条件集；至少基于各个备选规则针对所述当前样本集中的正样本的命中信息，评估各个备选规则的得分；其中，所述各个备选规则是将备选条件集中的各个备选条件分别添加到已选中条件集中得到的；选择得分最优的备选规则对应的备选条件，添加到已选中条件集中。
9.根据权利要求8所述的方法，其中，确定备选条件集，包括：通过剔除操作，得到剩余条件集，所述剔除操作包括，从所述条件总集中剔除所述已选中条件集；或者，确定所述已选中条件集中涉及的已选中特征项，从所述条件总集中剔除涉及所述已选中特征项的条件；基于剩余条件集，得到所述备选条件集。10.根据权利要求9所述的方法，其中，基于剩余条件集，得到所述备选条件集，包括：确定所述已选中条件集对应的既有规则的全局准确率作为既有准确率，所述全局准确率是针对所述第一样本集的正样本命中准确率；将所述剩余条件集中的各个条件分别添加到所述已选中条件集中，生成各个假定规则；确定各个假定规则的全局准确率，得到各个假定准确率；将假定准确率相对于所述既有准确率的提升超过预定阈值的若干条件，构成所述备选条件集。11.根据权利要求8所述的方法，其中，所述各个备选规则包括第一备选规则，评估各个备选规则的得分，包括：确定所述第一备选规则的全局准确率作为...

【专利技术属性】
技术研发人员：李有儒，梁仕威，陈少虎，沈开明，娄寅，钟文亮，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人