当前位置: 首页 > 专利查询>都柏林大学专利>正文

数据处理系统和方法技术方案

技术编号:2868756 阅读:165 留言:0更新日期:2012-04-11 18:40
一种用于从n个项目的数据库检索k个项目的子集(n>>k)的数据处理方法和系统,首先确定在所述数据库内的bk(b>1)个项目的有限子集,所述项目按照给定的相似性函数S而与输入的查询t具有最大相似性。然后通过下列方式来建立结果子集:将与查询t具有最高相似性S的那个项目来作为第一成员;循环地选择作为具有最高品质Q的bk个项目中的剩余项目的子集的每个接续成员,其中Q是针对输入的查询t的相似性S和相对于已经在结果子集中的项目的相对多样性RD的给定函数。以这种方式,结果子集的多样性相对于k个对查询t的最相似项目的简单选择被大大地提高,而仅仅在处理要求中有适度的额外增加。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于按照预定标准从数据库检索数据的系统和方法。
技术介绍
基于范例的推理(CBR)系统通过重新使用以前已经被解决作为范例被存储在范例库中的问题的解决方案来解决了新的问题。任何CBR系统的成功依赖于其选择用于正确目标问题的正确范例的能力(参见例如Kolodner,J.Case-Based Reasoning.Morgan Kaufmann,1993;Smyth,B.and Keane,M.Adaptation-Guided RetrievalQuestioning the Similarity Assumption inReasoning.Artificial Intelligence,102249-293,1998;Aamodt,A.And Plaza,E.Case-Based ReasoningFoundational Issues,Methodological Variations,andSystem Approaches.AI Communications,7(1)39-52,1994)。传统的智慧在于正确范例在最相似于目标问题的那些范例中,因此相当多的研究努力已经被投入用于评价范例相似性的技术和策略中(也参见Faltings,B.Probabilistic Indexing for Case-Based Prediction.InProceedings ofthe 2nd International Conference on Case-Based Reasoning,pages 611-622.Springer-Verlag,1997;Leake,D.B.Case-Based ReasoningExperiences,Lessons and Future Directions.AAAI/MIT Press,1996;Smyth,B.and McKenna,E.Incremental Footprint-Based Retrieval.InProceedings of the 21st SGESInternational Conference on Knowledge Based Systems and Applied ArtificialIntelligence,pages 89-101.Springer Verlag,2000)近来,已经清楚传统的相似性观念不总是理想的,激励许多研究者寻找替代的方式来在给定的问题解决环境中判断范例的效用(例如参见Bergmann,R.,Richter,M.,Schmitt,S.,Stahl,A.And Vollrath,I.Utility-Oriented MatchingA New Research Direction for Case-Based Reasoning.InProceedings of theGerman Workshop on Case-Based Reasoning,2001;Burke,R.ConceptualIndexing and Active Retrieval of Video for Interactive Leaming Environments.Knowledge-Based Systems,9(8)491-499,1996;Fox,S.And Leake,D.B.UsingIntrospective Reasoning to Refine Indexing.InProceedings of the 14thInternational Joint Conference on Artificial Intelligence,pages 391-397.MorganKaufmann,1995;Kolodner,J.Judging which is the“best”case for a case-basedreasoner.InProceedings of the Second Workshop on Case-Based Reasoning,pages 77-81.Morgan Kaufmann,1989;Leake D.B.Constructive SimilarityAssessmentUsing Stored Cases to Define New Situations.InProceedings of the14th Annual Conference of the Cognitive Science Society,pages 313-318.Lawrence Earlbaum Associates,1992)。例如,研究者已经查看了与相似性并列的适应性的重要性,争论在一个范例看起来与目标问题相似的时候,这不意味着它可以成功地被适配与这个目标。因特网现在几乎与所谓的信息超载问题同义,因为用户发现越来越难于在正确的时间找到正确的信息。近来,已经开发了一种被称为推荐器系统的新型信息系统来更好地服务于单独用户的信息需求。推荐器系统组合来自信息检索、人工智能和用户简档(userr profiling)的技术,以便积极地预测单独用户的需求和提供更为个性化的信息服务。诸如Entrée(Burke,R.A case-based approach to collaborative filtering.InProceedings of the 5th European Workshop on Case-Based Reasoning.Springer-Verlag,2000)的许多推荐器系统使用CBR策略,用于选择对于给定的查询的最相似范例。Entree运行在饭店领域,使得用户可以使用诸如烹调类型、价格等的特征来查询饭店范例库。通过设计,Entree返回单个的最佳范例,但是使得用户如果他们不满意所述范例则可以修整这个结果,以便产生对于新的搜索的改进的查询。经常地,一个推荐器系统被设计来返回多个相似的范例,以便向用户提供推荐的选择。例如,诸如旅游或财产推荐器的广泛应用通常对于一个用户查询返回k个最佳范例(假日整体计划或房间列表)。目的是以单个搜索来满足用户需要,因此检索多个范例,并且最大化在结果列表中出现很多的相关范例的似然性,因此向相似性提供优先级。但是,这个标准纯粹基于相似性的检索策略在一些应用领域中有缺陷。考虑一个旅游推荐器用户提交一个针对下列情况的查询两人夏天的2星期假日,花费少于750美元,在爱尔兰的3小时飞行时间内,并且现场具有良好的夜生活和娱乐设施。所返回的顶级推荐是西班牙的Costa Del Sol中一个具体的公寓楼中的一个公寓,在7月中的前两个星期。这可能是一个良好的推荐,但是如果第二、第三和第四个推荐来自同一公寓楼——即使可能是在夏天的不同的两星期时段则如何?在k个最佳推荐全部与目标查询很相似的同时,它们彼此也很相似。如果第一个推荐不适合,则用户未已经接收到一组有益的替代推荐。例如,在这个示例中,如果用户决定避开Costa DelSol,然后没有任何替代推荐满足需要,她必须启动新的搜索。通过在检索期间将相似性优先化,一种标准的基于范例的手段将隐含地忽略了检索多样性的重要性,这本文档来自技高网...

【技术保护点】
一种数据处理方法,用于从n个项目的数据库检索k个项目的子集(n>>k),所述方法包括:(a)确定在n个项目的数据库中的bk(b>1)个项目,所述n个项目按照给定的相似性函数S而与输入的查询t具有最大相似性;(b)选择与查询t 具有最高相似性S的在bk个项目中的那个项目来作为子集的第一成员;(c)循环地选择作为具有最高品质Q的bk个项目中的剩余项目的子集的每个接续成员,其中Q是针对输入的查询t的相似性S和相对多样性RD的给定函数,其中相对的多样性RD是对于 在前面的循环期间所选择的项目中的那个剩余项目的给定多样性函数。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:巴里J史密斯
申请(专利权)人:都柏林大学
类型:发明
国别省市:IE[爱尔兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1