一种运维工单的查询推荐方法及装置制造方法及图纸

技术编号:26171317 阅读:31 留言:0更新日期:2020-10-31 13:43
本发明专利技术公开了一种运维工单的查询推荐方法及装置,通过在服务器的内存中构建高频读取块,高频读取块包括一个临时保存数据的虚拟表和一个索引映射表;利用余弦相似度算法来计算查询文本与存储器中文本相似度;根据相似度以决定是读取内存中的虚拟表还是外部存储器中的数据库;能够实现快速的读取高速度内存中预加载的高命中率的记录,而不需要从较慢的外部存储器中读取数据,极大的提高了服务器的搜索响应速度,不需要存储大量的偏好特征数据、历史查询数据以满足未来的搜索需求搜索量,无需额外的数据存储需求,适用于小型的轻量化系统的数据库的快速搜索。减小了搜索查询的时间复杂度。

【技术实现步骤摘要】
一种运维工单的查询推荐方法及装置
本公开涉及数据搜索技术、数据库查询交互
,具体涉及一种运维工单的查询推荐方法及装置。
技术介绍
在用户查询时,用户在搜索的输入框中输入部分查询词字符时,大多数查询系统一般会推荐出符合用户的搜索意图,并自动按照相关度的高低和用户搜索的历史频度进行排序,并弹出用户有可能查询的关键词条以供用户进行选择,从而极大地节约了用户查询的时间。目前的查询词推荐方法一般是阿里巴巴集团控股有限公司的CN201210548573.9,接收输入的字符,并确定输入所述字符的用户标识信息;获取所述用户标识信息对应的偏好特征向量,所述偏好特征向量包括偏好查询词和偏好查询词对应的权重;通过该权重计算所述候选查询词向量与所述偏好特征向量的相似度;根据所述相似度和所述候选查询词对应的权重对所述候选查询词进行排序得到推荐查询词。另一种是百度在线网络技术(北京)有限公司的申请号为CN201410352570.7的当获取到推荐查询词展现事件之时,根据用户的历史查询词,获取推荐查询词;向所述用户展现所述推荐查询词,根据所述用户的搜索指示进行本文档来自技高网...

【技术保护点】
1.一种运维工单的查询推荐方法,其特征在于,所述方法包括以下步骤:/n步骤1,用户登录客户端,在服务器的内存中构建高频读取块,高频读取块包括一个临时保存数据的虚拟表和一个索引映射表:/n步骤2,在数据库的数据表中读取用户最近一个时间阈值内搜索次数大于搜索阈值的所有的词所对应的记录,将所述记录写入到内存中的虚拟表中;读取相同记录的虚拟表和数据库中对应表的主键或索引,将所述主键或索引写入到索引映射表中;/n步骤3,接收来自于用户从客户端输入的文本数据;/n步骤4,对文本数据进行分词,并对文本数据进行特征提取得到特征向量作为第一特征向量;/n步骤5,利用余弦相似度算法来依次计算第一特征向量和虚拟表中...

【技术特征摘要】
1.一种运维工单的查询推荐方法,其特征在于,所述方法包括以下步骤:
步骤1,用户登录客户端,在服务器的内存中构建高频读取块,高频读取块包括一个临时保存数据的虚拟表和一个索引映射表:
步骤2,在数据库的数据表中读取用户最近一个时间阈值内搜索次数大于搜索阈值的所有的词所对应的记录,将所述记录写入到内存中的虚拟表中;读取相同记录的虚拟表和数据库中对应表的主键或索引,将所述主键或索引写入到索引映射表中;
步骤3,接收来自于用户从客户端输入的文本数据;
步骤4,对文本数据进行分词,并对文本数据进行特征提取得到特征向量作为第一特征向量;
步骤5,利用余弦相似度算法来依次计算第一特征向量和虚拟表中所有记录中的文本数据的第二特征向量之间的各个相似度,所述相似度定义为第一相似度;
步骤6,当发现各个第一相似度大于或等于相似度阈值的文本数据,从虚拟表中读取文本数据对应的记录,并将记录推送到客户端展示;
步骤7,当所有的第一相似度均小于相似度阈值时,访问外部存储设备中数据库并利用余弦相似度算法来依次计算第一特征向量和数据库中所有记录中的文本数据的第三特征向量之间的各个相似度,所述相似度定义为第二相似度,并从数据库中读取各个第二相似度中的值最大的文本数据,将文本数据对应的记录替换掉虚拟表中用户最近一个时间阈值内搜索次数最小的词所对应的记录,并将相同记录的虚拟表和数据库中对应表的主键或索引,读取到索引映射表中,从虚拟表中读取文本数据对应的记录,并将记录推送到客户端展示。


2.根据权利要求1所述的一种运维工单的查询推荐方法,其特征在于,在步骤1中,在服务器的内存中构建高频读取块的方法为:在服务器的内存中构建一个高频读取块,高频读取块包括一个临时保存数据的虚拟表和一个索引映射表,虚拟表是从外部存储设备中的数据库中读取到内存中用于临时保存数据的数据表,其包含的所有字段与数据库中对应数据表的字段相同;索引映射表包括虚拟表和数据库中对应表的主键或索引,至少包括虚拟表中记录的序号和数据库中对应表的记录的序号,通过索引映射表将虚拟表中的记录和数据库中相同的记录相关联,根据索引映射表中保存的对应的主键或索引可以快速的定位到虚拟表中的记录和数据库中相同的记录;其中,每条记录都存储有一个工单的文本数据。


3.根据权利要求1所述的一种运维工单的查询推荐方法,其特征在于,在步骤1中,数据库中的数据是以表为单位进行组织的;一个表是一组相关的按行排列的数据;每个表中都含有相同类型的信息,表实际上是一个二维表格。


4.根据权利要求1所述的一种运维工单的查询推荐方法,其特征在于,在步骤2中,时间阈值默认取168小时;搜索阈值默认设置为3次;均可人工调整。


5.根据权利要求1所述的一种运维工单的查询推荐方法,其特征在于,在步骤4中,对文本数据进行分词的方法为:
S401:通过Jieba,SnowNLP,PkuSeg,THULAC,HanLP中任意一种中文分词工具进行分词并进行词性标...

【专利技术属性】
技术研发人员:杨朝谊陈康莲刘铭传
申请(专利权)人:广东电网有限责任公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1