数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:38100421 阅读:10 留言:0更新日期:2023-07-06 09:17
本公开提供了一种数据处理方法,可以应用于大数据技术领域和金融技术领域。该方法包括:响应于用户查询请求,通过解析用户查询请求获取参考字段,参考字段至少包括目标查询时段字段以及用户所属的目标机构字段;基于目标查询时段字段和目标机构字段,从数据库中读取生成时间在目标查询时段之前,且与目标机构关联的目标历史查询日志数据;将目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组;将目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从多份已打标数据中确定多份目标数据。本公开还提供了一种数据处理装置、设备、存储介质和程序产品。序产品。序产品。

【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质


[0001]本公开涉及大数据
和金融
,尤其涉及一种数据处理方法、装置、设备、介质和程序产品。

技术介绍

[0002]在各种数据统计分析的场景下,工作人员在统计工作中,基于多个不同的业务板块下会产生数量非常庞大的业务成果数据,而在下一次统计工作中往往会调阅历史业务成果数据作为参考,同时,在项目总结时,需要对成果进行分类统计,以便更好的从全局上去统计业务成果数据。
[0003]在实现本公开的过程中发现,由于业务成果数据数量庞大,且业务成果为非结构化信息,针对这些非结构化的业务成果去进行查询时,业务人员往往需要花费大量的精力去从多年积累的数量庞大的业务成果中寻找自己所需要的信息,导致人力成本高、工作效率低下,且对庞大数据的处理过程加大了计算机的计算资源的消耗。并且,用户查询时,无法提前预知合适的查询检索词,因此很难通过用户直接输入的查询检索词匹配到合适的数据。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种数据处理方法、装置、设备、介质和程序产品。
[0005]本公开的一个方面,提供了一种数据处理方法,包括:
[0006]响应于用户查询请求,通过解析上述用户查询请求获取参考字段,上述参考字段至少包括目标查询时段字段以及用户所属的目标机构字段;
[0007]基于上述目标查询时段字段和上述目标机构字段,从数据库中读取生成时间在上述目标查询时段之前,且与上述目标机构关联的目标历史查询日志数据;
[0008]将上述目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组;
[0009]将上述目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从上述多份已打标数据中确定多份目标数据。
[0010]根据本公开的实施例,将上述目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组包括:
[0011]将上述目标历史查询日志数据与多个上述查询语义词组进行匹配,计算得到各个上述查询语义词组对应的关注值;
[0012]将上述关注值大于第一预设阈值的查询语义词组确定为上述目标查询语义词组。
[0013]根据本公开的实施例,上述查询语义词组包括多级语义单元,上述多级语义单元之间存在业务关联关系;
[0014]将上述目标历史查询日志数据与多个上述查询语义词组进行匹配,计算得到各个上述查询语义词组对应的关注值包括:
[0015]确定上述查询语义词组中各级上述语义单元在上述目标历史查询日志数据中的出现次数;
[0016]根据各级上述语义单元的上述出现次数,计算得到各个上述查询语义词组对应的关注值。
[0017]根据本公开的实施例,上述查询语义词组包括第一类查询语义词组和第二类查询语义词组;
[0018]上述第一类查询语义词组包括多级第一类语义单元,上述多级第一类语义单元包括:控制要素、控制内容、控制效果;
[0019]上述第二类查询语义词组包括多级第二类语义单元,上述多级第二类语义单元包括:风险主体、风险动作、风险对象。
[0020]根据本公开的实施例,上述已打标数据的数据标签包括多级标签字段,上述查询语义词组包括多级语义单元;
[0021]将上述目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从上述多份已打标数据中确定多份目标数据包括:
[0022]将上述已打标数据的数据标签中的多级标签字段,与上述目标查询语义词组中的多级语义单元进行语义匹配,计算得到各个上述已打标数据的匹配度值;
[0023]将上述匹配度值大于第二预设阈值的已打标数据确定为上述目标数据。
[0024]根据本公开的实施例,将上述已打标数据的数据标签中的多级标签字段,与上述目标查询语义词组中的多级语义单元进行语义匹配,计算得到各个上述已打标数据的匹配度值包括:
[0025]将上述多级标签字段中的各级标签字段分别进行特征转换,得到多个标签特征向量;
[0026]将上述多级语义单元中的各级语义单元分别进行特征转换,得到多个语义特征向量;
[0027]计算上述多个标签特征向量和上述多个语义特征向量之间相似度值;
[0028]根据上述多个标签特征向量和上述多个语义特征向量之间相似度值,计算得到各个上述已打标数据的匹配度值。
[0029]根据本公开的实施例,上述数据处理方法还包括:
[0030]从用户客户端获取打分数值,上述打分数值用于表征用户对上述多份目标数据所体现的检索结果的满意程度;
[0031]在上述打分数值小于第三预设阈值的情况下,接收源自于客户端的自定义查询语义词组,
[0032]将上述自定义查询语义词组和多份已打标数据的数据标签进行关联,以使得从上述多份已打标数据中确定多份自定义查询数据。
[0033]根据本公开的实施例,上述数据处理方法还包括:
[0034]对上述多份目标数据进行统计分析,输出统计结果;
[0035]将上述统计结果进行可视化展示。
[0036]本公开的另一个方面提供了一种数据处理装置,包括:第一获取模块、生成模块、第一关联模块和第二关联模块。其中,第一获取模块,用于响应于用户查询请求,通过解析
上述用户查询请求获取参考字段,上述参考字段至少包括目标查询时段字段以及用户所属的目标机构字段。生成模块,用于基于上述目标查询时段字段和上述目标机构字段,从数据库中读取生成时间在上述目标查询时段之前,且与上述目标机构关联的目标历史查询日志数据。第一关联模块,用于将上述目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组。第二关联模块,用于将上述目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从上述多份已打标数据中确定多份目标数据。
[0037]本公开的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述数据处理方法。
[0038]本公开的另一个方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述数据处理方法。
[0039]本公开的另一个方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述数据处理方法。
[0040]根据本公开提供的数据处理方法、装置、设备、介质和程序产品,响应于用户查询请求,通过解析用户查询请求能够至少获取目标查询时段字段以及用户所属的目标机构字段,基于目标查询时段字段和目标机构字段,可以从数据库中读取生成时间在目标查询时段之前,且与目标机构关联的目标历史查询日志数据,并将目标历史查询日志数据与多个预定义的查询语义词组进行关联,可以从多个预定义的查询语义词组中得到目标查询语义词组,最后将目标查询语义词组作为检索词与多份已打标数据的数据标签进行关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:响应于用户查询请求,通过解析所述用户查询请求获取参考字段,所述参考字段至少包括目标查询时段字段以及用户所属的目标机构字段;基于所述目标查询时段字段和所述目标机构字段,从数据库中读取生成时间在所述目标查询时段之前,且与所述目标机构关联的目标历史查询日志数据;将所述目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组;将所述目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从所述多份已打标数据中确定多份目标数据。2.根据权利要求1所述的方法,将所述目标历史查询日志数据与多个预定义的查询语义词组进行关联,得到目标查询语义词组包括:将所述目标历史查询日志数据与多个所述查询语义词组进行匹配,计算得到各个所述查询语义词组对应的关注值;将所述关注值大于第一预设阈值的查询语义词组确定为所述目标查询语义词组。3.根据权利要求2所述的方法,其中:所述查询语义词组包括多级语义单元,所述多级语义单元之间存在业务关联关系;将所述目标历史查询日志数据与多个所述查询语义词组进行匹配,计算得到各个所述查询语义词组对应的关注值包括:确定所述查询语义词组中各级所述语义单元在所述目标历史查询日志数据中的出现次数;根据各级所述语义单元的所述出现次数,计算得到各个所述查询语义词组对应的关注值。4.根据权利要求3所述的方法,其中:所述查询语义词组包括第一类查询语义词组和第二类查询语义词组;所述第一类查询语义词组包括多级第一类语义单元,所述多级第一类语义单元包括:控制要素、控制内容、控制效果;所述第二类查询语义词组包括多级第二类语义单元,所述多级第二类语义单元包括:风险主体、风险动作、风险对象。5.根据权利要求1所述的方法,其中,所述已打标数据的数据标签包括多级标签字段,所述查询语义词组包括多级语义单元;将所述目标查询语义词组和多份已打标数据的数据标签进行关联,以使得从所述多份已打标数据中确定多份目标数据包括:将所述已打标数据的数据标签中的多级标签字段,与所述目标查询语义词组中的多级语义单元进行语义匹配,计算得到各个所述已打标数据的匹配度值;将所述匹配度值大于第二预设阈值的已打标数据确定为所述目标数据。6.根据权利要求5所述的方法,其中,将所述已打标数据的数据标签中的多级标签...

【专利技术属性】
技术研发人员:冀慎华吴婷舒昭王晓晨文蓉蓉赵娥刘荣苏宁王京鹏郑金中
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1