基于重复数据筛选的数据排序方法、装置、设备及介质制造方法及图纸

技术编号：30348183 阅读：16 留言：0更新日期：2021-10-16 16:41

本发明专利技术涉及智能决策领域，揭露一种基于重复数据筛选的数据排序方法，包括：根据接收的查询请求对预设的资源数据集进行相关性筛选排序，得到查询结果序列；对查询结果序列进行标签分类，得到第一分类结果序列；对第一分类结果序列进行相关度分类，得到第二分类结果序列；对第二分类结果序列进行重复数据筛选，并将筛选的重复数据进行指数降分计算，得到第三分类结果序列；将第三分类结果序列中所有资源数据按照每个资源数据对应相关度分数进行排序，得到目标查询结果序列。本发明专利技术还涉及一种区块链技术，所述查询结果序列可以存储在区块链节点中。本发明专利技术还提出一种基于重复数据筛选的数据排序装置、设备以及介质。本发明专利技术可以提高数据排序的效率。高数据排序的效率。高数据排序的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于重复数据筛选的数据排序方法、装置、设备及介质

[0001]本专利技术涉及智能决策领域，尤其涉及一种基于重复数据筛选的数据排序方法、装置、电子设备及可读存储介质。

技术介绍

[0002]目前，数据排序在数据检索及数据推荐领域应用的非常广泛。在这种检索和推荐场景下，通常对检索或推荐的数据进行相关度打分，将所有数据按照分值从高到低降序进行排序展示。
[0003]但是由于检索或推荐的数据通常是非常丰富甚至会出现重复的，目前的数据排序方式会存在将相同或相似的数据堆在一起进行展示的问题，相似内容扎堆出现覆盖占据了大量的显示空间，导致对有效信息的获取变得困难，数据排序的效率低。

技术实现思路

[0004]本专利技术提供一种基于重复数据筛选的数据排序方法、装置、电子设备及计算机可读存储介质，其主要目的在于提高数据排序的效率。
[0005]为实现上述目的，本专利技术提供的一种基于重复数据筛选的数据排序方法，包括：
[0006]根据接收的查询请求对预设的资源数据集进行相关性筛选排序，得到查询结果序列；
[0007]对所述查询结果序列进行标签分类，得到第一分类结果序列；
[0008]对所述第一分类结果序列进行相关度分类，得到第二分类结果序列；
[0009]对所述第二分类结果序列进行重复数据筛选，并将筛选的重复数据进行指数降分计算，得到第三分类结果序列；
[0010]将所述第三分类结果序列中所有资源数据按照每个资源数据对应相关度分数进行排序，得到目标查询结果序列；<...

【技术保护点】

【技术特征摘要】
1.一种基于重复数据筛选的数据排序方法，其特征在于，所述方法包括：根据接收的查询请求对预设的资源数据集进行相关性筛选排序，得到查询结果序列；对所述查询结果序列进行标签分类，得到第一分类结果序列；对所述第一分类结果序列进行相关度分类，得到第二分类结果序列；对所述第二分类结果序列进行重复数据筛选，并将筛选的重复数据进行指数降分计算，得到第三分类结果序列；将所述第三分类结果序列中所有资源数据按照每个资源数据对应相关度分数进行排序，得到目标查询结果序列；将所述目标查询结果序列发送至所述查询请求对应的终端设备。2.如权利要求1所述的基于重复数据筛选的数据排序方法，其特征在于，所述根据所述查询请求对预设的资源数据集进行相关性筛选排序，得到查询结果序列，包括：提取所述查询请求中的查询字段，将所述查询字段转换为向量，得到查询向量；将所述资源数据集中的每个资源数据转换为向量，得到对应的资源向量；计算所述查询向量及所述资源向量的相关度，得到对应的相关度分数；筛选所述资源数据集中所述相关度分数大于预设相关度的资源数据，得到所述初始查询结果序列；将所述初始查询结果序列中所有资源数据按照对应的相关度分数大小进行排序，得到所述查询结果序列。3.如权利要求1所述的基于重复数据筛选的数据排序方法，其特征在于，所述对所述第一分类结果序列进行相关度分类，得到第二分类结果序列，包括：根据所述查询结果序列构建分值区间；利用所述分值区间对所述第一分类结果序列进行分类，得到所述第二分类结果序列。4.如权利要求3所述的基于重复数据筛选的数据排序方法，其特征在于，所述根据所述查询结果序列构建分值区间，包括：筛选所述查询结果序列的最大相关度分数，得到第一区间数据；筛选所述查询结果序列的最小相关度分数，得到第二区间数据；将所述第一区间数据及所述第二区间数据进行平均计算，得到第三区间数据；将所述第一区间数据、第二区间数据及所述第三区间数据作为区间端点值构建两个连续区间，得到所述分值区间。5.如权利要求1至4中任意一项所述的基于重复数据筛选的数据排序方法，其特征在于，所述对所述第二分类结果序列进行重复数据筛选，并将筛选的重复数据进行指数降分计算，得到第三分类结果序列，包括：利用预设算法对所述第二分类结果序列中每个资源数据进行编码，得到对应的数据编码；计算所述第二分类结果序列对应的所有数据编码中任意两个数据编码的文本距离；...

【专利技术属性】
技术研发人员：李珊，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人