一种获取标签的数据处理系统技术方案

技术编号：38441363 阅读：11 留言：0更新日期：2023-08-11 14:23

本发明专利技术提供了一种获取标签的数据处理系统，包括：初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器，当计算机程序被处理器执行时，实现以下步骤：获取第一用户信息；根据第一用户信息和初始问题文本，获取目标问题文本；根据目标问题文本，获取目标SQL字符串；根据目标SQL字符串，获取指定用户ID列表；根据目标SQL字符串，获取指定用户ID列表对应的指定标签。可知，本发明专利技术对初始问题文本进行扩充，获取目标问题文本，对目标问题文本中的第一实体进行处理，获取第三实体，根据第三实体以及第一实体之间的关系生成SQL字符串，对SQL字符串进行分析，智能生成标签，有利于提高获取标签的精准度。利于提高获取标签的精准度。利于提高获取标签的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
一种获取标签的数据处理系统

[0001]本专利技术涉及数据库处理领域，特别是涉及一种获取标签的数据处理系统。

技术介绍

[0002]随着计算机技术的快速发展，对于每个任务都会存在成千上万个任务数据列表，目标用户无法从成千上万个任务数据列表中找出需要的数据，因此，根据目标用户输入的检索语句，对任务数据列表中的数据智能生成标签，通过标签可以直接获取到目标用户需要的数据，现有的获取标签的方法大多为将数据检索语句输入信息抽取模型，获取检索语句中的实体，根据实体在数据库中进行检索并生成标签。
[0003]但上述方法也存在以下技术问题：
[0004]根据检索语句在数据库中进行搜索并生成标签的过程中，只根据检索语句中的实体进行检索，没有根据实体的语义以及实体之间的关系进行分析，因此，仅依据实体进行检索，难以将检索语句对应的数据全部检索到，从而获取到的标签精准度较低。

技术实现思路

[0005]针对上述技术问题，本专利技术采用的技术方案为：
[0006]一种获取标签的数据处理系统，包括：初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器，其中，初始任务数据集中包括若干个初始任务数据列表，每一初始任务数据列表均包括若干个字段名，当计算机程序被处理器执行时，实现以下步骤：
[0007]S100、根据目标用户ID与初始用户信息列表，获取目标用户ID对应的第一用户信息，其中，第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息。
[0008...

【技术保护点】

【技术特征摘要】
1.一种获取标签的数据处理系统，其特征在于，所述系统包括：初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器，其中，所述初始任务数据集中包括若干个初始任务数据列表，每一所述初始任务数据列表均包括若干个字段名，当所述计算机程序被所述处理器执行时，实现以下步骤：S100、根据目标用户ID与初始用户信息列表，获取目标用户ID对应的第一用户信息，其中，第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息；S200、根据第一用户信息和初始问题文本，获取目标问题文本；S300、根据目标问题文本，获取目标SQL字符串，其中，在S300步骤中包括如下步骤获取目标SQL字符串：S301、将目标问题文本输入到预设实体识别模型中，获取目标问题文本对应的第一实体列表B＝{B1，
……
，B
i
，
……
，B
m
}和B对应的实体关系列表C＝{C1，
……
，C
i
，
……
C
m
}，C
i
＝{C
i1
，
……
，C
ij
，
……
，C
in
}，B
i
为目标问题文本对应的第i个第一实体，i＝1
……
m，m为目标问题文本对应的第一实体数量，C
ij
为B
i
和D
j
之间的实体关系，D
j
为B中除B
i
以外的第j个第一实体，j＝1
……
n；S303、根据预设知识图谱列表，获取B对应的第二实体列表E＝{E1，
……
，E
i
，
……
，E
m
}，E
i
为B
i
对应的第二实体；S305、根据初始任务数据集，获取E对应的第三实体列表F＝{F1，
……
，F
i
，
……
，F
m
}，F
i
为E
i
对应的第三实体；S307、将C和F输入到预设自然语言模型中，获取目标SQL字符串；S400、根据目标SQL字符串，从初始任务数据集中获取指定用户ID列表；S500、根据目标SQL字符串，获取指定用户ID列表对应的指定标签。2.根据权利要求1所述的获取标签的数据处理系统，其特征在于，在S200步骤中包括如下步骤：S201、根据第一用户信息，获取第一文本列表A＝{A1，A2}，A1为第一文本，A2为与A1有关联的关键文本，其中，第一文本为第一用户信息中除用户ID和用户姓名以外的其他任一一个用户信息，与第一文本有关联的关键文本为第一用户信息中除用户ID、用户姓名、第一文本对应的用户信息以外的其他任一一个用户信息；S203、将A1、A2和初始问题文本输入至预设语义融合模型中，获取目标问题文本。3.根据权利要求1所述的获取标签的数据处理系统，其特征在于，在S303步骤中包括如下步骤：S3031、获取预设知识图谱列表对应的第一中间实体列表U＝{U1，
……
，U
y
，
……
，U
q
}，U
y
为预设知识图谱列表对应的第y个第一中间实体，y＝1
……
q，q为预设知识图谱列表对应的第一中间实体数量，第一中间实体为预设知识图谱列表中预设知识图谱中的实体；S3033、将B
i
输入至预设词向量提取模型中，获取B
i
对应的第一实体词向量列表Z
i
＝{Z
i1
，
……
，Z
ig
，
……
，Z
ih
}，Z
ig
为B
i
对应的第g个第一实体词向量，g＝1
……
h，h为B
i
对应的第一实体词向量数量；S3035、将U
y
输入至预设词向量提取模型中，获取U
y
对应的第二实体词向量列表V

【专利技术属性】
技术研发人员：袁凯，王宇伦，叶新江，方毅，
申请(专利权)人：每日互动股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人