基于标签用户模型的信息检索方法技术

技术编号：40677032 阅读：4 留言：0更新日期：2024-03-18 19:15

本发明专利技术涉及数据识别技术领域，具体涉及基于标签用户模型的信息检索方法。该方法是一种应用电子设备进行识别的方法，利用人工智能优化操作系统完成信息检索优化。首先识别各用户的资源对应的标签，对资源和标签进行数据处理得到参考用户，对参考用户的资源进行排序，实现信息检索的优化。本发明专利技术通过对资源和对应的标签进行分析得到参考用户，进一步对利用参考用户的检索信息，实现检索用户检索之后得到的检索信息的排序和优化，提高了用户的检索效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据识别，具体涉及基于标签用户模型的信息检索方法。

技术介绍

1、用户在对资源进行检索时，往往通过该资源所具有的性质进行检索，该资源所具有的性质也即该资源所对应的标签。其中，标签是用户根据主观的认识和理解，用词汇对网络资源进行的描述，标签用户模型也即指通过用户对不同资源的标签数据的集合来表示用户的方法。

2、目前，常见的用户获取资源的标签数据的方法为：对所有资源的标签进行全局遍历，其花费的时间较长，检索出来的资源较多，用户仍需要从大量结果中进行选取，检索效率较低。

技术实现思路

1、为了解决上述技术问题，本专利技术的目的在于提供基于标签用户模型的信息检索方法，所采用的技术方案具体如下：

2、获取每个用户对各资源打上的标签；基于所述资源和对应的所述标签，构建各用户对应的资源标签二分图和资源标签节点；

3、基于所述资源标签节点，计算任意两两用户的用户相似度；基于所述用户相似度对所有用户进行聚类，得到多个用户标签类别和对应的多个用户标签类别中心用户；获取用户的各标签的使用频率；对于任意标签，基于所述使用频率对所有用户进行聚类，得到多个单标签类别和对应的多个单标签类别中心用户；

4、选取任意用户作为目标用户，选取任意标签作为目标标签，计算所述目标用户和对应的用户标签类别中心用户的类别距离；所述类别距离的倒数作为第一参考值；

5、基于所述目标标签，根据所述目标用户所属单标签类别内的使用频率计算第二参考值；当所述目标用户

6、将目标用户对应的参考用户的资源按照使用频率进行排序。

7、优选的，所述基于所述资源和对应的所述标签，构建各用户对应的资源标签二分图和资源标签节点，包括：

8、对于任意用户，将资源和对应的标签进行连线，构建各用户对应的资源标签二分图；将资源和对应的所述标签进行标号，作为资源标签节点。

9、优选的，所述基于所述用户相似度对所有用户进行聚类，得到多个用户标签类别和对应的多个用户标签类别中心用户，包括：

10、将用户相似度大于预设相似度阈值的用户分至同一个用户标签类别；对于任意所述用户标签类别，选取与类别内其他用户的用户相似度之和最大的用户作为用户标签类别中心用户；对于未分至用户标签类别内的未分组用户，计算所述未分组用户和各所述用户标签类别的用户标签类别中心用户的用户相似度，将所述未分组用户分至最大用户相似度对应的用户标签类别，多次迭代计算直至将所有所述未分组用户分至用户标签类别中，对应的迭代更新每个用户标签类别的用户标签类别中心用户。

11、优选的，所述对于任意标签，基于所述使用频率对所有用户进行聚类，得到多个单标签类别，包括：

12、选取任意标签作为第一标签，基于各用户对所述第一标签的使用频率，利用多阈值分割得到多个类别，作为单标签类别。

13、优选的，所述选取任意用户作为目标用户，选取任意标签作为目标标签，计算所述目标用户和对应的用户标签类别中心用户的类别距离，包括：

14、基于所述目标标签，当所述目标用户和对应的用户标签类别中心用户属于同一个单标签类别时，将零作为所述目标用户和对应的用户标签类别中心用户的类别距离；当所述目标用户和对应的用户标签类别中心用户不属于同一个单标签类别时，计算所述目标用户所属单标签类别内的使用频率的均值作为第一均值，计算对应的用户标签类别中心用户所属单标签类别内的使用频率的均值作为第二均值；所述第一均值和所述第二均值的差值作为所述目标用户和对应的用户标签类别中心用户的类别距离。

15、优选的，所述根据所述目标用户所属单标签类别内的使用频率计算第二参考值，包括：

16、获取所述目标用户所属单标签类别的单标签类别中心用户对应的使用频率作为第一使用频率；获取所述目标用户所属单标签类别内的最大使用频率；所述第一使用频率和所述最大使用频率的比值为第二参考值。

17、优选的，所述将目标用户对应的参考用户的资源按照使用频率进行排序，包括：

18、基于所述目标用户对应的参考用户的所有资源中的任意资源，获取所有参考用户的使用频率之和作为总使用频率；根据所述总使用频率对所有所述参考用户的资源进行排序。

19、优选的，所述用户相似度的计算方法为：计算任意两两用户对应的资源标签节点的交并比作为用户相似度。

20、本专利技术实施例至少具有如下有益效果：

21、本专利技术实施例利用数据识别技术，该方法首先获取每个用户对各资源打上的标签；构建各用户对应的资源标签二分图和资源标签节点；计算任意两两用户的用户相似度，对所有用户进行聚类，得到多个用户标签类别和对应的多个用户标签类别中心用户；用户标签类别是基于用户的资源标签节点进行聚类的，从用户的认知方面作为后续参考用户的选取导向。获取用户的各标签的使用频率；对于任意标签，基于使用频率对所有用户进行聚类，得到多个单标签类别和对应的多个单标签类别中心用户；单标签类别是基于用户的标签使用频率进行聚类的，从用户的标签的使用频率方面作为后续参考用户的选取导向；选取任意用户作为目标用户，任意标签作为目标标签，计算目标用户和对应的用户标签类别中心用户的第一参考值；基于目标标签，根据目标用户所属单标签类别内的使用频率计算第二参考值；比较目标用户的目标标签对应的第一参考值和第二参考值得到参考用户；将目标用户对应的参考用户的资源按照使用频率进行排序。本专利技术通过对资源和对应的标签进行分析得到参考用户，进一步对利用参考用户的检索信息，实现检索用户检索之后得到的检索信息的排序和优化，提高了用户的检索效率。

本文档来自技高网...

【技术保护点】

1.基于标签用户模型的信息检索方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述基于所述资源和对应的所述标签，构建各用户对应的资源标签二分图和资源标签节点，包括：

3.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述基于所述用户相似度对所有用户进行聚类，得到多个用户标签类别和对应的多个用户标签类别中心用户，包括：

4.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述对于任意标签，基于所述使用频率对所有用户进行聚类，得到多个单标签类别，包括：

5.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述选取任意用户作为目标用户，选取任意标签作为目标标签，计算所述目标用户和对应的用户标签类别中心用户的类别距离，包括：

6.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述根据所述目标用户所属单标签类别内的使用频率计算第二参考值，包括：

7.根据权利要求1所述的基于标签用户模型的信息检

8.根据权利要求1所述的基于标签用户模型的信息检索方法，其特征在于，所述用户相似度的计算方法为：计算任意两两用户对应的资源标签节点的交并比作为用户相似度。

...

【技术特征摘要】

1.基于标签用户模型的信息检索方法，其特征在于，该方法包括以下步骤：

5.根据权利要求1所述的基...

【专利技术属性】
技术研发人员：李阳扬，张森，
申请(专利权)人：北京智乐享科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人