基于相似度的数据对比查询方法及系统技术方案

技术编号:19822024 阅读:104 留言:0更新日期:2018-12-19 14:47
公开了一种基于相似度的数据对比查询方法及系统。该方法可以包括:分析待查字符串,提取待查字符串的多个关键词;检索多个关键词,获得多个对比字符串;将待查字符串分别与每一个对比字符串进行计算,获得对比字符串对应的相似度系数;根据相似度系数的大小,对多个对比字符串进行排序。本发明专利技术通过对比待查字符串与对比字符串,计算相似度系数,实现快速精准的查询数据。

【技术实现步骤摘要】
基于相似度的数据对比查询方法及系统
本专利技术涉及信息
,更具体地,涉及一种基于相似度的数据对比查询方法及系统。
技术介绍
大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,其具有5大特点:大量、高速、多样、价值、真实性。但是,目前的大数据查询多为人力手动,效率较低。因此,有必要开发一种基于相似度的数据对比查询方法及系统。公开于本专利技术
技术介绍
部分的信息仅仅旨在加深对本专利技术的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
技术实现思路
本专利技术提出了一种基于相似度的数据对比查询方法及系统,其能够通过对比待查字符串与对比字符串,计算相似度系数,实现快速精准的查询数据。根据本专利技术的一方面,提出了一种基于相似度的数据对比查询方法。所述方法可以包括:分析待查字符串,提取所述待查字符串的多个关键词;检索所述多个关键词,获得多个对比字符串;将所述待查字符串分别与每一个所述对比字符串进行计算本文档来自技高网...

【技术保护点】
1.一种基于相似度的数据对比查询方法,包括:分析待查字符串,提取所述待查字符串的多个关键词;检索所述多个关键词,获得多个对比字符串;将所述待查字符串分别与每一个所述对比字符串进行计算,获得所述对比字符串对应的相似度系数;根据所述相似度系数的大小,对所述多个对比字符串进行排序。

【技术特征摘要】
1.一种基于相似度的数据对比查询方法,包括:分析待查字符串,提取所述待查字符串的多个关键词;检索所述多个关键词,获得多个对比字符串;将所述待查字符串分别与每一个所述对比字符串进行计算,获得所述对比字符串对应的相似度系数;根据所述相似度系数的大小,对所述多个对比字符串进行排序。2.根据权利要求1所述的基于相似度的数据对比查询方法,其中,每一个所述对比字符串包括至少一个所述关键词。3.根据权利要求1所述的基于相似度的数据对比查询方法,其中,还包括:将所述多个关键词根据重要程度进行排序,并对每一个关键词赋予重点因子。4.根据权利要求3所述的基于相似度的数据对比查询方法,其中,所述相似度系数为:Fj=∑Aiwi(1)其中,Fj表示第j个对比字符串的相似度系数,j取[1,M],M表示对比字符串的个数,wi表示该对比字符串与待查字符串相同的关键词,Ai表示该关键词对应的重点因子,i取[1,N],N表示关键词的个数。5.一种基于相似度的数据对...

【专利技术属性】
技术研发人员:孙英辉姚天
申请(专利权)人:芜湖智权大数据运营有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1