多级智能字符串比较方法技术

技术编号:2888772 阅读:231 留言:0更新日期:2012-04-11 18:40
一种多级数据库检索方法,它包括第一步:仅考虑文本多图形的频率;第二步,考虑多图形的位置和粗约的近似查询字符串和数据库字符串的适当的准直性;第三步,提供一个更好的近似准直。最后输出是一个按照其与查询的近似度排序的建议数据库记录的列表。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据库检索,具体地说,涉及一种基于对分加权匹配的高容错且高效率的数据库查询方法。更进一步讲,本专利技术的多级数据库查询方法包括第一步仅考虑原文复写频率,第二步考虑复写的位置和粗约的近似查询和数据库字符串之间适定的同心度,第三步提供更好的准直近似,最后输出为一个以其与查询近似度排序的建议数据库记录的列表。在过去的十年中,“数据库”已经从一个相对少量的高结构化共同数据处理的环境中的用户的应用转变为一个主流计算中心的应用,这在很大程度上归因于过去十年在连接上的进步。八十年代中期流行的局域网已被国际互连网络代替,同时存取数据库的计算机用户群已由多少有些相同的和以地域定位的群体转变为一个高度分散的群体,他们遍布世界,讲多种语言。本专利技术是一种软件方法,由软件控制计算机执行,它致力于由于这些变化而引起的一个中心问题,那就是,对于小型和中型大小的数据库的坚固的半结构化文本查询问题。本专利技术的关键就在于比较两个文本字符串并返回一个指明相似性的数值。典型地,这些字符串中的一个是用户的查询,另外的是从数据库中获得的一字符串。因为这个功能非常快速,它可在可以接受的时间里用要查询数据本文档来自技高网...

【技术保护点】
一种根据一查询检索数据库的方法,其特征在于包括如下步骤:(a)提供一数据库字符串;(b)提供一查询字符串;(c)识别既存在于所述查询字符串又存在于所述数据库字符串中的多图形;(d)提供每一所述识别的多图形的花费;(e)将 查询字符串相对于每一数据库字符串定位;(f)将存在于查询字符串和每一个数据库字符串中的多图形匹配,比较的花费提供所述查询字符串和每一所述数据库字符串之间的数值指示的相似性;(g)重新准直所述的查询字符串以减少花费,这通过检查存在于匹 配方案中的边界来实现;(h)重复所述的匹配和上述重新准直至一预定的次数或直到匹配花费不再增加...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:彼德N亚尼洛斯
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1