一种获取标签的数据处理系统技术方案

技术编号:38441363 阅读:11 留言:0更新日期:2023-08-11 14:23
本发明专利技术提供了一种获取标签的数据处理系统,包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取第一用户信息;根据第一用户信息和初始问题文本,获取目标问题文本;根据目标问题文本,获取目标SQL字符串;根据目标SQL字符串,获取指定用户ID列表;根据目标SQL字符串,获取指定用户ID列表对应的指定标签。可知,本发明专利技术对初始问题文本进行扩充,获取目标问题文本,对目标问题文本中的第一实体进行处理,获取第三实体,根据第三实体以及第一实体之间的关系生成SQL字符串,对SQL字符串进行分析,智能生成标签,有利于提高获取标签的精准度。利于提高获取标签的精准度。利于提高获取标签的精准度。

【技术实现步骤摘要】
一种获取标签的数据处理系统


[0001]本专利技术涉及数据库处理领域,特别是涉及一种获取标签的数据处理系统。

技术介绍

[0002]随着计算机技术的快速发展,对于每个任务都会存在成千上万个任务数据列表,目标用户无法从成千上万个任务数据列表中找出需要的数据,因此,根据目标用户输入的检索语句,对任务数据列表中的数据智能生成标签,通过标签可以直接获取到目标用户需要的数据,现有的获取标签的方法大多为将数据检索语句输入信息抽取模型,获取检索语句中的实体,根据实体在数据库中进行检索并生成标签。
[0003]但上述方法也存在以下技术问题:
[0004]根据检索语句在数据库中进行搜索并生成标签的过程中,只根据检索语句中的实体进行检索,没有根据实体的语义以及实体之间的关系进行分析,因此,仅依据实体进行检索,难以将检索语句对应的数据全部检索到,从而获取到的标签精准度较低。

技术实现思路

[0005]针对上述技术问题,本专利技术采用的技术方案为:
[0006]一种获取标签的数据处理系统,包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,其中,初始任务数据集中包括若干个初始任务数据列表,每一初始任务数据列表均包括若干个字段名,当计算机程序被处理器执行时,实现以下步骤:
[0007]S100、根据目标用户ID与初始用户信息列表,获取目标用户ID对应的第一用户信息,其中,第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息。
[0008]S200、根据第一用户信息和初始问题文本,获取目标问题文本。
[0009]S300、根据目标问题文本,获取目标SQL字符串,其中,在S300步骤中包括如下步骤获取目标SQL字符串:
[0010]S301、将目标问题文本输入到预设实体识别模型中,获取目标问题文本对应的第一实体列表B={B1,
……
,B
i

……
,B
m
}和B对应的实体关系列表C={C1,
……
,C
i

……
C
m
},C
i
={C
i1

……
,C
ij

……
,C
in
},B
i
为目标问题文本对应的第i个第一实体,i=1
……
m,m为目标问题文本对应的第一实体数量,C
ij
为B
i
和D
j
之间的实体关系,D
j
为B中除B
i
以外的第j个第一实体,j=1
……
n。
[0011]S303、根据预设知识图谱列表,获取B对应的第二实体列表E={E1,
……
,E
i

……
,E
m
},E
i
为B
i
对应的第二实体。
[0012]S305、根据初始任务数据集,获取E对应的第三实体列表F={F1,
……
,F
i

……
,F
m
},F
i
为E
i
对应的第三实体。
[0013]S307、将C和F输入到预设自然语言模型中,获取目标SQL字符串。
[0014]S400、根据目标SQL字符串,从初始任务数据集中获取指定用户ID列表。
[0015]S500、根据目标SQL字符串,获取指定用户ID列表对应的指定标签。
[0016]本专利技术至少具有以下有益效果:
[0017]本专利技术提供了一种获取标签的数据处理系统,包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取第一用户信息;根据第一用户信息和初始问题文本,获取目标问题文本;根据目标问题文本,获取目标SQL字符串;根据目标SQL字符串,获取指定用户ID列表;根据目标SQL字符串,获取指定用户ID列表对应的指定标签。可知,本专利技术对初始问题文本进行扩充,获取目标问题文本,对目标问题文本中的第一实体进行处理,获取第三实体,根据第三实体以及第一实体之间的关系生成SQL字符串,对SQL字符串进行分析,智能生成标签,有利于提高获取标签的精准度。
附图说明
[0018]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术实施例提供的一种获取标签的数据处理系统执行计算机程序的流程图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
[0022]本专利技术的实施例提供了一种获取标签的数据处理系统,包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,其中,初始任务数据集中包括若干个初始任务数据列表,每一初始任务数据列表均包括若干个字段名,当计算机程序被处理器执行时,实现以下步骤,如图1所示:
[0023]S100、根据目标用户ID与初始用户信息列表,获取目标用户ID对应的第一用户信息,其中,第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息,本领域技术人员知晓,现有技术中任一从初始用户信息列表中获取与目标用
户ID一致的初始用户ID的方法,均属于本专利技术的保护范围,在此不再赘述。
[0024]具体地,初始用户信息列表中的初始用户信息为本领域技术人员根据实际需求预先设置好的用户信息。
[0025]进一步地,用户信息包括:用户ID、用户姓名、用户所属部门、用户职称。
[0026]具体地,所述初始任务数据列表为用户指定的待处理任务的数据列表,例如,待处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取标签的数据处理系统,其特征在于,所述系统包括:初始用户信息列表、初始任务数据集、处理器和存储有计算机程序的存储器,其中,所述初始任务数据集中包括若干个初始任务数据列表,每一所述初始任务数据列表均包括若干个字段名,当所述计算机程序被所述处理器执行时,实现以下步骤:S100、根据目标用户ID与初始用户信息列表,获取目标用户ID对应的第一用户信息,其中,第一用户信息为初始用户信息列表中与目标用户ID一致的初始用户ID对应的初始用户信息;S200、根据第一用户信息和初始问题文本,获取目标问题文本;S300、根据目标问题文本,获取目标SQL字符串,其中,在S300步骤中包括如下步骤获取目标SQL字符串:S301、将目标问题文本输入到预设实体识别模型中,获取目标问题文本对应的第一实体列表B={B1,
……
,B
i

……
,B
m
}和B对应的实体关系列表C={C1,
……
,C
i

……
C
m
},C
i
={C
i1

……
,C
ij

……
,C
in
},B
i
为目标问题文本对应的第i个第一实体,i=1
……
m,m为目标问题文本对应的第一实体数量,C
ij
为B
i
和D
j
之间的实体关系,D
j
为B中除B
i
以外的第j个第一实体,j=1
……
n;S303、根据预设知识图谱列表,获取B对应的第二实体列表E={E1,
……
,E
i

……
,E
m
},E
i
为B
i
对应的第二实体;S305、根据初始任务数据集,获取E对应的第三实体列表F={F1,
……
,F
i

……
,F
m
},F
i
为E
i
对应的第三实体;S307、将C和F输入到预设自然语言模型中,获取目标SQL字符串;S400、根据目标SQL字符串,从初始任务数据集中获取指定用户ID列表;S500、根据目标SQL字符串,获取指定用户ID列表对应的指定标签。2.根据权利要求1所述的获取标签的数据处理系统,其特征在于,在S200步骤中包括如下步骤:S201、根据第一用户信息,获取第一文本列表A={A1,A2},A1为第一文本,A2为与A1有关联的关键文本,其中,第一文本为第一用户信息中除用户ID和用户姓名以外的其他任一一个用户信息,与第一文本有关联的关键文本为第一用户信息中除用户ID、用户姓名、第一文本对应的用户信息以外的其他任一一个用户信息;S203、将A1、A2和初始问题文本输入至预设语义融合模型中,获取目标问题文本。3.根据权利要求1所述的获取标签的数据处理系统,其特征在于,在S303步骤中包括如下步骤:S3031、获取预设知识图谱列表对应的第一中间实体列表U={U1,
……
,U
y

……
,U
q
},U
y
为预设知识图谱列表对应的第y个第一中间实体,y=1
……
q,q为预设知识图谱列表对应的第一中间实体数量,第一中间实体为预设知识图谱列表中预设知识图谱中的实体;S3033、将B
i
输入至预设词向量提取模型中,获取B
i
对应的第一实体词向量列表Z
i
={Z
i1

……
,Z
ig

……
,Z
ih
},Z
ig
为B
i
对应的第g个第一实体词向量,g=1
……
h,h为B
i
对应的第一实体词向量数量;S3035、将U
y
输入至预设词向量提取模型中,获取U
y
对应的第二实体词向量列表V

【专利技术属性】
技术研发人员:袁凯王宇伦叶新江方毅
申请(专利权)人:每日互动股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1