基于实体检索词的用户行为意图挖掘方法技术

技术编号:24168940 阅读:27 留言:0更新日期:2020-05-16 02:19
本发明专利技术涉及一种基于实体检索词的用户行为意图挖掘方法,用于根据用户提供的实体检索词分析挖掘用户的行为意图并得到用户的潜在行为列表,基于实体检索词的用户行为意图挖掘方法包括以下步骤:步骤1:基于实体检索词,通过多渠道获得与实体检索词相关的若干行为文本并将行为文本作为行为样本来构建行为样本池,行文文本由动词和动词的修饰短语构成;步骤2:分析行为样本池中行为样本的特征;基于行为样本的特征,通过迭代得到若干行为样本排序构成的用户的潜在行为列表。本发明专利技术能够基于用户提供的实体检索词对用户行为意图进行挖掘,可以更好的满足用户对于检索精准度的要求和对检索词相关内容扩展的需求。

【技术实现步骤摘要】
基于实体检索词的用户行为意图挖掘方法
本专利技术涉及信息检索领域,具体涉及一种用于分析用户行为意图的基于实体检索词的用户行为意图挖掘方法。
技术介绍
根据先前研究表明,与用户意图相比用户的检索通常与更加具体的潜在行为紧密关联。由于实体名词或以实体名词为核心构成的检索短语在用户的提交检索数据中占据绝大多数,这些实体名词可成为的用户行为意图的主要信息来源。如何利用这些实体检索词分析挖掘用户的行为意图是信息检索领域需要解决的技术问题。
技术实现思路
本专利技术的目的是提供一种能够根据用户提供的实体检索词分析挖掘用户的行为意图的方法。为达到上述目的,本专利技术采用的技术方案是:一种基于实体检索词的用户行为意图挖掘方法,用于根据用户提供的实体检索词分析挖掘用户的行为意图并得到用户的潜在行为列表,所述基于实体检索词的用户行为意图挖掘方法包括以下步骤:步骤1:基于所述实体检索词,通过多渠道获得与所述实体检索词相关的若干行为文本并将所述行为文本作为行为样本来构建行为样本池,所述行文文本由动词和动词的修饰短语构成;...

【技术保护点】
1.一种基于实体检索词的用户行为意图挖掘方法,用于根据用户提供的实体检索词分析挖掘用户的行为意图并得到用户的潜在行为列表,其特征在于:所述基于实体检索词的用户行为意图挖掘方法包括以下步骤:/n步骤1:基于所述实体检索词,通过多渠道获得与所述实体检索词相关的若干行为文本并将所述行为文本作为行为样本来构建行为样本池,所述行文文本由动词和动词的修饰短语构成;/n步骤2:分析所述行为样本池中所述行为样本的特征;基于所述行为样本的特征,通过迭代得到若干所述行为样本排序构成的所述用户的潜在行为列表。/n

【技术特征摘要】
1.一种基于实体检索词的用户行为意图挖掘方法,用于根据用户提供的实体检索词分析挖掘用户的行为意图并得到用户的潜在行为列表,其特征在于:所述基于实体检索词的用户行为意图挖掘方法包括以下步骤:
步骤1:基于所述实体检索词,通过多渠道获得与所述实体检索词相关的若干行为文本并将所述行为文本作为行为样本来构建行为样本池,所述行文文本由动词和动词的修饰短语构成;
步骤2:分析所述行为样本池中所述行为样本的特征;基于所述行为样本的特征,通过迭代得到若干所述行为样本排序构成的所述用户的潜在行为列表。


2.根据权利要求1所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述步骤1中,通过个人社交网络上的推文和/或检索引擎检索得到的文本获得若干所述行为文本。


3.根据权利要求2所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:通过所述个人社交网络上的推文获得所述行为文本的方法包括基于历史推文检索获得所述行为文本、基于随机推文检索获得所述行为文本和基于与所述实体检索词相关的个人社交网络用户的推文检索获得所述行为文本。


4.根据权利要求1所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述步骤2中,所述行为样本的特征包括显著性、代表性和多样性;所述显著性表征所述行为样本在所述行为样本池中的使用频率和用例频率,所述代表性表征所述行为样本池中所述行为样本所处空间的行为样本密度,所述多样性表征所述行为样本与其他所述行为样本之间的差异度,分别分析所述行为文本的动词和动词的修饰短语...

【专利技术属性】
技术研发人员:丁俊王勇石佳戴岳郭锐谭文韬周佳威周震海钮佳伟陆超唐智敏崔鲁周仰东
申请(专利权)人:苏州电力设计研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1