【技术实现步骤摘要】
一种用户信息搜索的数据处理系统
[0001]本专利技术涉及信息检索
,特别是涉及一种用户信息搜索的数据处理系统。
技术介绍
[0002]随着互联网的快速发展,搜索任务中存在众多结构化数据,用户查找目标数据时,需要在众多结构化数据中根据问题文本进行搜索,获取目标数据,现有的查询结构化的数据的方法大多为,对结构化数据进行分类,获取问题文本对应的目标结构化数据,并获取目标结构化数据对应的关键词,对问题文本中的关键词和目标结构化数据对应的关键词进行处理,获取目标数据。
[0003]但是上述方法也存在以下技术问题:一方面,对问题文本中的关键词和目标结构化数据对应的关键词进行处理,获取目标数据,无法根据不同的目标问题文本确定不同的处理方法,只能通过一种处理方法获取目标数据;另一方面,在获取目标数据的过程中,没有数据召回的过程,忽视了数据表之间的关联,只对关键词进行处理,获取到的目标数据的不够精准,可知,根据上述方法获取到的目标数据的精准度较低。
技术实现思路
[0004]针对上述技术问题,本专利技术采用的技 ...
【技术保护点】
【技术特征摘要】
1.一种用户信息搜索的数据处理系统,其特征在于,所述系统包括:初始行为名称字符串列表、处理器和存储有计算机程序的存储器,其中,当所述计算机程序被所述处理器执行时,实现以下步骤:S100、获取指定行为名称字符串A和指定问题文本B,其中,A为指定用户输入的字符串,B为指定用户输入的文本;S200、根据A和初始行为名称字符串列表,获取指定行为用户信息集C;S300、根据B和C,获取指定用户对应的关键用户信息列表;其中,在S300步骤中包括如下步骤:S301、获取第一预设模型标识列表L={L1,L2,
……
,L
e
,
……
,L
f
},L
e
为第e个第一预设模型标识,e=1,2
……
f,f为第一预设模型数量,第一预设模型为用于获取标签、标签对应的标签值以及标签值对应的权重的神经网络模型;S303、将B输入至L
e
对应的第一预设模型中,获取L
e
对应的第一标签值列表M
e
={M
e1
,M
e2
},M
e1
为L
e
对应的第一标签字符串,M
e2
为M
e1
对应的第一标签值;S305、根据M
e1
和M
e2
,获取关键配置列表N={N1,N2,
……
,N
g
,
……
,N
h
},N
g
={N
g1
,N
g2
,N
g3
,N
g4
,N
g5
},N
g1
为第g个关键配置列表中的索引字符串,N
g2
为第g个关键配置列表中的SQL字符串,N
g3
为第g个关键配置列表中的合并标识,N
g4
为第g个关键配置列表中的状态标识,N
g5
为第g个关键配置列表中的转换标识,g=1,2
……
h,h为关键配置列表数量,所述合并标识为:采用某种操作对两个列表进行合并的标识,所述状态标识为:判断是否继续获取列表的标识,所述转换标识为:采用某种操作对列表进行处理转换的标识;S307、确定N
h
对应的第一中间用户信息列表T
h
对应的第二中间用户信息列表P
h
为关键用户信息列表;S400、根据关键用户信息列表,获取指定用户对应的目标用户信息列表。2.根据权利要求1所述的用户信息搜索的数据处理系统,其特征在于,在S200步骤中包括如下步骤:S201、获取初始行为名称字符串列表F={F1,F2,
……
,F
i
,
……
,F
m
},F
i
为第i个初始行为名称字符串,i=1,2
……
m,m为初始行为名称字符串数量;S203、将A输入至预设词向量提取模型中,获取A对应的第一名称词向量列表G={G1,G2,
……
,G
j
,
……
,G
n
},G
j
为第j个第一名称词向量,j=1,2
……
n,n为第一名称词向量数量;S205、将F输入至预设词向量提取模型中,获取F对应的第二名称词向量列表H={H1,H2,
……
,H
i
,
……
,H
m
},H
i
={H
i1
,H
i2
,
……
,H
ij
,
……
,H
in
},H
ij
为F
i
对应的第j个第二名称词向量;S207、根据G
j
和H
ij
,获取A对应的第一名称字符串相似度列表K={K1,K2,
……
,K
i
,
……
,K
m
},K
i
为A和F
i
之间的第一名称字符串相似度,其中,K
i
符合如下条件:K
i
=(Σ
nj=1
(G
j
×
H
ij
))/((Σ
nj=1
G
j2
)
1/2
×
(Σ
nj=1
H
ij
)
1/2
);S209、当K
i
=1时,确定F
i
对应的初始行为用户信息集为C。3.根据权利要求1所述的用户信息搜索的数据处理系统,其特征在于,在S305步骤中包括如下步骤:S3051、当g=1时,对所有的M
e1
和M
e2
进行分析,生成N
g
;S3053、根据N
g1
和N
g2
,从C中获取N对应的第一中间用户信息列表T={T1,T2,
……
,
T
g
,
……
,T
h
},T
g
为N
g
对应的第一中间用户信息列表,其中,用户信息集中符合N
g1
的且同时符合N
g2
的用户信息作为第一中间用户信息;S3055、根据T和N
g3
,获取T对应的第二中间用户信息列表P={P1,P2,
……...
【专利技术属性】
技术研发人员:赵洲洋,于伟,靳雯,王全修,石江枫,
申请(专利权)人:日照睿安信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。