一种基于知识图谱的路径分析的推理研究系统及方法技术方案

技术编号:38664072 阅读:24 留言:0更新日期:2023-09-02 22:45
本发明专利技术涉及互联网信息技术领域,具体涉及一种基于知识图谱的路径分析的推理研究系统,包括:控制终端,是系统的主控端,用于发出执行命令;监测模块,用于监测用户端于搜索引擎中输入的文字数据;提取模块,用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;本发明专利技术通过对搜索引擎在被用户端执行搜索操作时键入的文字数据的分析,对搜索引擎所提供的联想词带来了一定程度的优化,从而使得所述引擎在由用户端键入文字数据进行搜索查找时所提供的联想词更加符合用户的搜索需求,从而以此达到提升用户对于搜索引擎使用体验的目的。目的。目的。

【技术实现步骤摘要】
一种基于知识图谱的路径分析的推理研究系统及方法


[0001]本专利技术涉及互联网信息
,具体涉及一种基于知识图谱的路径分析的推理研究系统及方法。

技术介绍

[0002]所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
[0003]然而,现有的搜索引擎技术中,对于用户端键入的文字信息进行检索查找时,所提供过的用于辅助检索查找的联想词往往单单根据用户端的键入文字信息次数进行输出,其与键入文字信息进行检索查找操作的用户端的实际需求存在一定差异,以至于影响到搜索引擎对于用户端的使用体验。

技术实现思路

[0004]针对现有技术所存在的上述缺点,本专利技术提供了一种基于知识图谱的路径分析的推理研究系统及方法,解决了上述
技术介绍
中提出的技术问题。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现:第一方面,一种基于知识图谱的路径分析的推理研究系统,包括:控制终端,是系统的主控端,用于发出执行命令;监测模块,用于监测用户端于搜索引擎中输入的文字数据;提取模块,用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;配置模块,用于分析监测模块中监测到的文字数据与提取模块中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置;识别模块,用于接收监测模块中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率;队列模块,用于接收识别模块中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列。
[0006]更进一步地,所述监测模块对监测到的用户端于搜索引擎中输入的文字数据同步储存,用户端于搜索引擎中输入文字数据阶段,监测模块实时监测用户端点击的搜索引擎提供的联想词及重新于搜索引擎中输入的文字数据,并记录基于联想词打开网页及各打开网页停留时间。
[0007]更进一步地,所述提取模块下级设置有子模块,包括:储存单元,用于储存提取模块中接收到的数据内容;
匹配单元,用于分析储存单元中储存的数据内容相似度,设定相似度判定阈值,对处于同一相似度判定阈值的数据内容于储存单元中区分储存;其中,匹配单元还用于分析用户端于搜索引擎中输入的文字数据与各数据内容的相似度。
[0008]更进一步地,所述数据内容相似度通过下式进行求取,公式为:;式中:为数据内容i、j间的欧式距离;为数据内容i、j间的曼哈顿距离;为数据内容i、j间的Chebyshev距离;为数据内容i、j间的Canberra距离;;;;;n为数据内容i与j的维度;为数据内容i中字段的特征向量;为数据内容及j中字段的特征向量;其中,所述搜索引擎中输入的文字数据与各数据内容的相似度应用上式进行求取。
[0009]更进一步地,所述数据内容中的特征字词,通过于数据内容中截取相邻文字组成字段与文字数据库中查找相同项进行确认;其中,所述文字数据库由词语字典中存在的词语完成构建,于数据内容中截取相邻文字组成字段时,以两个文字、三个文字及四个文字的截取逻辑进行截取操作,截取相邻文字组成的字段用于数据内容相似度的计算。
[0010]更进一步地,所述配置模块中文字数据与特征字词间一致性通过数据内容相似度求取公式进行获取,配置模块运行阶段,进一步对用户端于搜索引擎中输入文字数据时搜索引擎提供的联想词、用户端重新于搜索引擎中输入的文字数据、用户端重新于搜索引擎中输入的文字数据对应提供的联想词、基于搜索引擎中输入文字数据或联想词打开的网页中包含的文字数据进行一致性判定,对判定为处于相同一致性判定阈值的联想词及文字数据,与特征字词所属数据内容进行进一步的相互配置;其中,搜索引擎通过用户端输入的文字数据提供联想词,且所述联想词于储存单元中储存的数据内容中提取,提取目标为数据内容中的任一特征字词。
[0011]更进一步地,所述识别模块运行阶段识别联想词使用频率时,以每次用户端于搜索引擎中新摄入文字数据作为一组识别周期,识别模块应用识别周期实时运行,并由下式对识别模块中识别到的联想词使用频率进行修正,公式为:;式中:为联想词使用频率修正结果;为实际联想词使用频率;为重输次数;
为联想词使用频率最低的文字数据对应打开网页次数;为联想词使用频率最高的文字数据对应打开网页次数。
[0012]更进一步地,所述联想词使用频率修正目标为所有用户端于搜索引擎中输入的文字数据及联想词;其中,队列模块在提供联想词队列时,应用的联想词使用频率的修正结果进行联想词队列的生成。
[0013]更进一步地,所述控制终端通过介质电性连接有监测模块及提取模块,所述提取模块下级通过介质电性连接有储存单元及匹配单元,所述监测模块及提取模块通过介质电性连接有配置模块及识别模块,所述配置模块通过介质电性连接与储存单元相连接,所述识别模块通过介质电性与监测模块相连接,所述识别模块通过介质电性连接有队列模块。
[0014]第二方面,一种基于知识图谱的路径分析的推理研究方法,包括以下步骤:步骤1:监测搜索引擎中用户端实时输入的文字数据;步骤2:上传数据内容,构建数据库对上传的数据内容进行储存,使构建的数据库作为搜索引擎对应配置的查找目标;步骤3:分析数据库中储存的各数据内容相互之间相似性,根据相似性分析结果对数据库中储存的各数据内容进行区分储存;步骤4:分析搜索引擎中用户端输入的文字数据与数据库中储存的各数据内容间一致性,根据一致性分析结果对数据库中储存的数据内容与文字数据进行相互配置;步骤5:计量搜索引擎中用户端输入文字数据时提供的联想词使用频率,对计量得到的使用频率进行修正;步骤6:根据修正结果,对搜索引擎中用户端输入的文字数据提供对应的联想词队列。
[0015]采用本专利技术提供的技术方案,与已知的公有技术相比,具有如下有益效果:1、本专利技术提供一种基于知识图谱的路径分析的推理研究系统,该系统通过对搜索引擎在被用户端执行搜索操作时键入的文字数据的分析,对搜索引擎所提供的联想词带来了一定程度的优化,从而使得所述引擎在由用户端键入文字数据进行搜索查找时所提供的联想词更加符合用户的搜索需求,从而以此达到提升用户对于搜索引擎使用体验的目的。
[0016]2、本专利技术中系统在运行过程中,通过文字数据的相似度求取及联想词使用频率的修正,为系统带来了更近一步的联想词输出优化,使得由该系统控制输出的联想词与用户端的实际需求匹配精度更高,进而使得用户短通过该系统配置的搜索引擎进行所需数据内容的搜索查找时,更加快捷、便利。
[0017]3、本专利技术中提供一种基于知识图谱的路径分析的推理研究方法,通过该方法中的步骤执行,能本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的路径分析的推理研究系统,其特征在于,包括:控制终端(1),是系统的主控端,用于发出执行命令;监测模块(2),用于监测用户端于搜索引擎中输入的文字数据;提取模块(3),用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;配置模块(4),用于分析监测模块(2)中监测到的文字数据与提取模块(3)中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置;识别模块(5),用于接收监测模块(2)中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率;队列模块(6),用于接收识别模块(5)中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列。2.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述监测模块(2)对监测到的用户端于搜索引擎中输入的文字数据同步储存,用户端于搜索引擎中输入文字数据阶段,监测模块(2)实时监测用户端点击的搜索引擎提供的联想词及重新于搜索引擎中输入的文字数据,并记录基于联想词打开网页及各打开网页停留时间。3.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述提取模块(3)下级设置有子模块,包括:储存单元(31),用于储存提取模块(3)中接收到的数据内容;匹配单元(32),用于分析储存单元(31)中储存的数据内容相似度,设定相似度判定阈值,对处于同一相似度判定阈值的数据内容于储存单元(31)中区分储存;其中,匹配单元(32)还用于分析用户端于搜索引擎中输入的文字数据与各数据内容的相似度。4.根据权利要求3所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述数据内容相似度通过下式进行求取,公式为:;式中:为数据内容i、j间的欧式距离;为数据内容i、j间的曼哈顿距离;为数据内容i、j间的Chebyshev距离;为数据内容i、j间的Canberra距离;;;;;n为数据内容i与j的维度;为数据内容i中字段的特征向量;为数据内容及j中字段的特征向量;其中,所述搜索引擎中输入的文字数据与各数据内容的相似度应用上式进行求取。5.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,
所述数据内容中的特征字词,通过于数据内容中截取相邻文字组成字段与文字数据库中查找相同项进行确认;其中,所述文字数据库由词语字典中存在的词语完成构建,于数据内容中截取相邻文字组成字段时,以两个文字、三个文字及四个文字的截取逻辑进行截取操作,截取相邻文字组成的字段用于数据内容相似度的计算。6.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述配置模块(4)中文字数据与特征字词间一致性通过数据内容相似度求取公式进行获取,配置模块(4...

【专利技术属性】
技术研发人员:隋媛孙兆洋
申请(专利权)人:中国标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1