基于查询匹配的文章排序方法、装置、电子设备及介质制造方法及图纸

技术编号：38196815 阅读：12 留言：0更新日期：2023-07-21 16:34

本发明专利技术涉及数字医疗领域的自然语言处理技术，揭露一种基于查询匹配的文章排序方法，包括：分别对查询文本序列和文章文本序列进行第一拼接处理和第二拼接处理，得到拼接查询序列和拼接文章序列，对拼接查询序列和拼接文章序列进行编码，得到查询编码向量及文章编码向量，对查询编码向量和文章编码向量进行范数标准化，得到标准查询向量和标准文章向量，计算标准查询向量和标准文章向量之间的匹配相似值，根据匹配相似值对多篇待查询文章进行排序，得到文章排序结果。此外，本发明专利技术还涉及区块链技术，匹配相似值可存储于区块链的节点。本发明专利技术还提出一种基于查询匹配的文章排序装置、电子设备以及存储介质。本发明专利技术可以提高文章排序的效率。序的效率。序的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于查询匹配的文章排序方法、装置、电子设备及介质

[0001]本专利技术涉及人工智能领域，尤其涉及一种基于查询匹配的文章排序方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展，各类不同的社交平台涌现，而在社交平台上会出现百万级甚至千万级的文章，社交平台的作用之一就是要将文章准确推送给用户，其中最关键的部分就是要对大量的文章进行排序，根据得到的文章排序结果进行推送。
[0003]现有的文章排序方法通常是通过交互模式实现，在交互模式中通过模型才能知道查询文本和待查询文章的匹配程度，无法提前计算文章的编码向量。但真实场景中文章的数量是巨大的，一般是百万甚至是千万级别，每个文章都和给定的查询重头计算匹配程度，会导致无法接受的时间延迟，从而带来不佳的用户体验，进而最终影响文章排序的效率。因此亟待提出一种效率更高的文章排序方法。

技术实现思路

[0004]本专利技术提供一种基于查询匹配的文章排序方法、装置、电子设备及存储介质，其主要目的在于提高文章排序的效率。
[0005]为实现上述目的，本专利技术提供的一种基于查询匹配的文章排序方法，包括：
[0006]获取查询文本序列及所述查询文本序列对应的多篇待查询文章，并将多篇所述待查询文章组合为文章文本序列；
[0007]将所述查询文本序列中的多个查询字符与预设的多个特殊字符进行第一拼接处理，得到拼接查询序列，并对所述文章文本序列进行第二拼接处理，得到拼接文章序列；
[0008]利用预设双向表征模型分别对...

【技术保护点】

【技术特征摘要】
1.一种基于查询匹配的文章排序方法，其特征在于，所述方法包括：获取查询文本序列及所述查询文本序列对应的多篇待查询文章，并将多篇所述待查询文章组合为文章文本序列；将所述查询文本序列中的多个查询字符与预设的多个特殊字符进行第一拼接处理，得到拼接查询序列，并对所述文章文本序列进行第二拼接处理，得到拼接文章序列；利用预设双向表征模型分别对所述拼接查询序列和所述拼接文章序列进行编码处理，得到查询编码向量及文章编码向量，并对所述查询编码向量和所述文章编码向量进行范数标准化处理，得到标准查询向量和标准文章向量；根据预设延迟匹配计算公式计算所述标准查询向量和所述标准文章向量之间的匹配相似值，并根据所述匹配相似值对多篇所述待查询文章进行排序，得到文章排序结果。2.如权利要求1所述的基于查询匹配的文章排序方法，其特征在于，所述将所述查询文本序列中的多个查询字符与预设特殊字符进行第一拼接处理，得到拼接查询序列，包括：将所述查询文本序列中的多个查询字符进行顺序排列，并在顺序排列后的多个查询字符的开头添加多个所述特殊字符中的开头标识字符，得到初始标识序列；在所述初始标识序列的后面添加预设个数的特殊字符中的掩码字符，得到拼接查询序列。3.如权利要求1所述的基于查询匹配的文章排序方法，其特征在于，所述利用预设双向表征模型对所述拼接查询序列进行编码处理，得到查询编码向量，包括：对所述拼接查询序列进行向量化处理，得到嵌入向量集；利用所述双向表征模型中的编码层对所述嵌入向量集进行编码处理，得到查询编码向量。4.如权利要求1所述的基于查询匹配的文章排序方法，其特征在于，所述对所述查询编码向量进行范数标准化处理，得到标准查询向量，包括：根据预设范数定义构建范数公式，并根据所述范数公式计算得到参考范数；将所述查询编码向量中的每个元素除以所述参考范数，得到标准查询向量。5.如权利要求1所述的基于查询匹配的文章排序方法，其特征在于，所述根据预设延迟匹配计算公式计算所述标准查询向量和所述标准文章向量之间的匹配相似值，包括：所述预设延迟匹配计算公式为：其中，S
q,d
为所述匹配相似值，E
qi
表示第i个标准查询向量,E
di
表示第i个标准文章向量,T表示转置矩阵，|
q
|表示所述标准查询向...

【专利技术属性】
技术研发人员：谯轶轩，姜鹏，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人