基于相关性分析的信息技术咨询服务系统技术方案

技术编号:38654206 阅读:12 留言:0更新日期:2023-09-02 22:41
本发明专利技术提供了信息检索咨询技术领域中的基于相关性分析的信息技术咨询服务系统,包括:字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组。本发明专利技术能够根据咨询字段数据对咨询结果的精准且快速的检索,并测算出检索结果与检索结果的对应性情况,并在无法检出时,快速确定出对应的偏离词组,以实现快速重新定义句式进行检索咨询。以实现快速重新定义句式进行检索咨询。以实现快速重新定义句式进行检索咨询。

【技术实现步骤摘要】
基于相关性分析的信息技术咨询服务系统


[0001]本专利技术涉及信息检索咨询
,尤其涉及基于相关性分析的信息技术咨询服务系统。

技术介绍

[0002]信息技术咨询过程中,常采用系统信息检索方式的快速查询定位到用户需求的咨询内容。而信息检索又是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。狭义的信息检索仅指信息查询。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。又称信息的存储与检索。
[0003]在用户或咨询服务人员利用信息咨询检索系统进行咨询检索时,由于不清楚检索内容是否符合检索结果对应的精准句式,因此常会出现检索内容难以精准的查询到对应的检索结果,需要耗费大量的对检索结果的阅读时间和精力以及重新检索时间和精力,而且重新检索也不便于确定到想要的检索句式以与相应的检索结果相对应。

技术实现思路

[0004]本专利技术的目的是针对现有技术的不足之处,提供基于相关性分析的信息技术咨询服务系统,解决信息技术咨询过程中难以快速定位咨询内容、咨询内容难以实现与咨询检索结果对应性的技术问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:基于相关性分析的信息技术咨询服务系统,包括:字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组;句式判断模块,所述句式判断模块判断各所述词序对应的所述原词组的所述临近词组数据组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的所述精准咨询句式,若不满足,则控制输出不满足句式要求的所述词序对应的原词组数据和指导词组,重新检索咨询;以及咨询输出模块,所述咨询输出模块根据输出的所述咨询句式,生成与所述精准咨询句式相应的咨询结果数据。
[0006]进一步的,所述字段拆分模块包括:字段采集模块,所述字段采集模块采集用户对所述信息技术的咨询字段数据;拆分控制模块,所述拆分控制模块控制对所述咨询字段数据进行对应的词组和/
或单字拆分,以获得所述原词组数据;以及排序处理模块,所述排序处理模块将所述原词组数据按照所述咨询字段数据对应的顺序进行次序的编码排序。
[0007]进一步的,所述相关数据查询模块包括:原词组调取模块,所述原词组调取模块依所述词序调取所述原词组数据信息;以及机器训练模块,所述机器训练模块根据所述原词组数据在机器训练库中查询出与所述原词组数据语义相近的所述正向临近词组和所反向临近词组,并进行分库临时存储。
[0008]进一步的,所述正向临近词组为所述原词组数据进行语义加重后的临近词组数据;所述反向临近词组为所述原词组数据进行语义减弱后的临近词组数据。
[0009]进一步的,所述机器训练模块包括:正向存储库,所述正向存储库存储机器训练出的所述正向临近词组,以及各所述正向临近词组以所述原词组为基准向所述原词组数据的语义加重侧的正向偏移度;以及反向存储库,所述反向存储库存储机器训练出的所述反向临近词组,以及各所述反向临近词组以所述原词组为基准向所述原词组数据的语义减弱侧的正向偏移度。
[0010]进一步的,所述句式判断模块包括:句式重组模块,所述句式重组模块查询满足预定数量n范围内的各所述正向临近词组和所述反向临近词组,并按词序编码顺序将所述正向临近词组和所述反向临近词组进行组合形成所述临近词组数据组成的临近字段句式;句式检索模块,所述句式检索模块根据所述临近词组数据组成的所述临近字段句式进行相似度最接近的所述精准咨询句式进行查询;句式筛选模块,所述句式筛选模块筛选出各所述临近字段句式对所述精准咨询句式相应的整体偏移权重满足预定偏移权重的所述临近字段句式;以及总偏移测算模块,所述总偏移测算模块根据满足预定偏移权重的所述临近字段句式的所述整体偏移权重,对基于所述原词组的总偏移权重进行测算。
[0011]进一步的,所述句式筛选模块包括:整体偏移权重测算模块,所述整体偏移权重测算模块根据所述正向临近词组对应所述精准咨询句式的正向权重参数和所述反向临近词组对应所述精准咨询句式的反向权重参数,对所述整体偏移权重进行乘积计算;以及句式控制模块,所述句式控制模块判断所述整体偏移权重在所述预定偏移权重范围内时,对所述总偏移权重进行测算,并在所述整体偏移权重未在所述预定偏移权重范围内时,将不满足句式要求的所述词序对应的原词组数据和指导词
组控制输出。
[0012]进一步的,所述句式控制模块包括:句式查询模块,所述句式查询模块在所述整体偏移权重未在所述预定偏移权重范围内时,调取出对应的所述精准咨询句式,并按所述原词组的拆分方式拆分成对应的精准词组数据;以及用户载入模块,所述用户载入模块分配在用户端系统作为所述指导词组。
[0013]进一步的,所述句式控制模块还包括:分偏移度调取模块,所述分偏移度调取模块调取各所述原词组对应的所述正向临近词组或所述反向临近词组的正向偏移度或反向偏移度;以及总偏移权重测算模块,所述总偏移权重测算模块根据所述原词组对相应的所述正向临近词组或所述反向临近词组的偏移权重参数或,以及所述正向临近词组或所述反向临近词组对应的所述正向偏移度或所述反向偏移度,对所述总偏移权重进行乘积测算。
[0014]进一步的,所述咨询输出模块包括:句式导出模块,所述句式导出模块导出所述精准咨询句式,以及导出所述精准咨询句式对应的咨询结果数据;以及偏移度输出模块,所述偏移度输出模块导出所述原词组对所述精准咨询句式对应词组的偏移情况,以及所述咨询字段数据对应的测算出的所述总偏移权重。
[0015]本专利技术的有益效果在于:通过将用户咨询内容对应的咨询字段数据进行原词组数据的拆分,并查询与原词组相应加重语义的正向临近词组数据和反向临近词组数据,再按照咨询句式数据的词序重新组合,查询出最为接近的精准咨询句式,根据各临近词组对应的临近字段句式对精准咨询句式偏移时的正向权重参数、反向权重参数以及各临近词组对应的临近字段句式对精准咨询句式偏移时的偏移度,计算出各临近词组对应的临近字段句式对精准组训句式的整体偏移权重。再根据原词组数据对临近词组的偏移度、以及原词组数据对临近词组偏移时的正向偏移权重参数和反向偏移权重参数,计算出原词组数据对临近词组的偏移权重,进而计算得到总偏移权重和各原词组对应精准咨询句式相应词组的偏移权重,从而更好的确认出检索咨询结果的精准性,同时能够根据各词组对精准咨询句式对应的检索结果的偏移情况,重新调整句式,以帮助快速调整咨询句式,提高检索咨询效率。
附图说明
[0016]图1为本专利技术咨询服务系统的架构图;图2为本专利技术字段拆分模块的架构图;图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于相关性分析的信息技术咨询服务系统,其特征在于,包括:字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组;句式判断模块,所述句式判断模块判断各所述词序对应的所述原词组的所述临近词组数据组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的所述精准咨询句式,若不满足,则控制输出不满足句式要求的所述词序对应的原词组数据和指导词组,重新检索咨询;以及咨询输出模块,所述咨询输出模块根据输出的所述咨询句式,生成与所述精准咨询句式相应的咨询结果数据。2.根据权利要求1所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述字段拆分模块包括:字段采集模块,所述字段采集模块采集用户对所述信息技术的咨询字段数据;拆分控制模块,所述拆分控制模块控制对所述咨询字段数据进行对应的词组和/或单字拆分,以获得所述原词组数据;以及排序处理模块,所述排序处理模块将所述原词组数据按照所述咨询字段数据对应的顺序进行次序的编码排序。3.根据权利要求1所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述相关数据查询模块包括:原词组调取模块,所述原词组调取模块依所述词序调取所述原词组数据信息;以及机器训练模块,所述机器训练模块根据所述原词组数据在机器训练库中查询出与所述原词组数据语义相近的所述正向临近词组和所反向临近词组,并进行分库临时存储。4.根据权利要求3所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述正向临近词组为所述原词组数据进行语义加重后的临近词组数据;所述反向临近词组为所述原词组数据进行语义减弱后的临近词组数据。5.根据权利要求3所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述机器训练模块包括:正向存储库,所述正向存储库存储机器训练出的所述正向临近词组,以及各所述正向临近词组以所述原词组为基准向所述原词组数据的语义加重侧的正向偏移度;以及反向存储库,所述反向存储库存储机器训练出的所述反向临近词组,以及各所述反向临近词组以所述原词组为基准向所述原词组数据的语义减弱侧的正向偏移度。6.根据权利要求5所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述句式判断模块包括:句式重组模块,所述句式重组模块查询满足预定数量n范...

【专利技术属性】
技术研发人员:黄福清
申请(专利权)人:天津市扬天环保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1