【技术实现步骤摘要】
一种获取标签的数据处理系统
[0001]本专利技术涉及数据库处理领域,特别是涉及一种获取标签的数据处理系统。
技术介绍
[0002]随着计算机技术的快速发展,对于每个任务都会存在成千上万个任务数据列表,目标用户无法从成千上万个任务数据列表中找出需要的数据,因此,根据目标用户输入的检索语句,对任务数据列表中的数据智能生成标签,通过标签可以直接获取到目标用户需要的数据,现有的获取标签的方法大多为将数据检索语句输入信息抽取模型,获取检索语句中的实体,根据实体在数据库中进行检索并生成标签。
[0003]但上述方法也存在以下技术问题:
[0004]根据检索语句在数据库中进行搜索并生成标签的过程中,只根据检索语句中的实体进行检索,没有根据实体的语义以及实体之间的关系进行分析,因此,仅依据实体进行检索,难以将检索语句对应的数据全部检索到,从而获取到的标签精准度较低。
技术实现思路
[0005]针对上述技术问题,本专利技术采用的技术方案为:
[0006]一种获取标签的数据处理系统,包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,其中,初始任务数据集中包括若干个初始任务数据列表,每一初始任务数据列表均包括若干个字段名,当计算机程序被处理器执行时,实现以下步骤:
[0007]S100、根据目标用户ID与初始用户信息列表,获取目标用户ID对应的第一用户信息,其中,第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息。
[0008 ...
【技术保护点】
【技术特征摘要】
1.一种获取标签的数据处理系统,其特征在于,所述系统包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,其中,所述初始任务数据集中包括若干个初始任务数据列表,每一所述初始任务数据列表均包括若干个字段名,当所述计算机程序被所述处理器执行时,实现以下步骤:S100、根据目标用户ID与初始用户信息列表,获取目标用户ID对应的第一用户信息,其中,第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息;S200、根据第一用户信息和初始问题文本,获取目标问题文本;S300、根据目标问题文本,获取目标SQL字符串,其中,在S300步骤中包括如下步骤获取目标SQL字符串:S301、将目标问题文本输入到预设实体识别模型中,获取目标问题文本对应的第一实体列表B={B1,
……
,B
i
,
……
,B
m
}和B对应的实体关系列表C={C1,
……
,C
i
,
……
C
m
},C
i
={C
i1
,
……
,C
ij
,
……
,C
in
},B
i
为目标问题文本对应的第i个第一实体,i=1
……
m,m为目标问题文本对应的第一实体数量,C
ij
为B
i
和D
j
之间的实体关系,D
j
为B中除B
i
以外的第j个第一实体,j=1
……
n;S303、根据预设知识图谱列表,获取B对应的第二实体列表E={E1,
……
,E
i
,
……
,E
m
},E
i
为B
i
对应的第二实体;S305、根据初始任务数据集,获取E对应的第三实体列表F={F1,
……
,F
i
,
……
,F
m
},F
i
为E
i
对应的第三实体;S307、将C和F输入到预设自然语言模型中,获取目标SQL字符串;S400、根据目标SQL字符串,从初始任务数据集中获取指定用户ID列表;S500、根据目标SQL字符串,获取指定用户ID列表对应的指定标签。2.根据权利要求1所述的获取标签的数据处理系统,其特征在于,在S200步骤中包括如下步骤:S201、根据第一用户信息,获取第一文本列表A={A1,A2},A1为第一文本,A2为与A1有关联的关键文本,其中,第一文本为第一用户信息中除用户ID和用户姓名以外的其他任一一个用户信息,与第一文本有关联的关键文本为第一用户信息中除用户ID、用户姓名、第一文本对应的用户信息以外的其他任一一个用户信息;S203、将A1、A2和初始问题文本输入至预设语义融合模型中,获取目标问题文本。3.根据权利要求1所述的获取标签的数据处理系统,其特征在于,在S303步骤中包括如下步骤:S3031、获取预设知识图谱列表对应的第一中间实体列表U={U1,
……
,U
y
,
……
,U
q
},U
y
为预设知识图谱列表对应的第y个第一中间实体,y=1
……
q,q为预设知识图谱列表对应的第一中间实体数量,第一中间实体为预设知识图谱列表中预设知识图谱中的实体;S3033、将B
i
输入至预设词向量提取模型中,获取B
i
对应的第一实体词向量列表Z
i
={Z
i1
,
……
,Z
ig
,
……
,Z
ih
},Z
ig
为B
i
对应的第g个第一实体词向量,g=1
……
h,h为B
i
对应的第一实体词向量数量;S3035、将U
y
输入至预设词向量提取模型中,获取U
y
对应的第二实体词向量列表V
【专利技术属性】
技术研发人员:袁凯,王宇伦,叶新江,方毅,
申请(专利权)人:每日互动股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。