一种对例句检索结果进行排序的方法和装置制造方法及图纸

技术编号:7103872 阅读:225 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种对例句检索结果进行排序的方法和装置,其中所述方法包括:A获取用户的查询词;B.从句库中检索包含所述查询词的匹配例句;C.计算所述查询词与各个匹配例句之间的搭配强度;D.按照所述查询词与匹配例句之间的搭配强度的大小对各个匹配例句进行排序。通过上述方式,能够更好地满足用户的语言学习的目的和需求,提高用户的浏览效率,同时减少了系统为满足用户需求而增加的响应次数。

【技术实现步骤摘要】
一种对例句检索结果进行排序的方法和装置
本专利技术涉及自然语言处理技术,特别涉及一种对例句检索结果进行排序的方法和直O
技术介绍
随着计算机与互联网技术的深入发展,人们在语言学习中借助计算机强大的计算能力来获取自己需要的信息成为可能,例句检索系统就是一种帮助语言学习的人们获取相关资讯的有力工具,其通过在大规模句库中检索与用户输入相匹配的例句,帮助用户获得相关语言的正确用法。但是,在现有的例句检索系统中,只能为用户提供包含用户查询词的例句,而没有对这些例句进行组织,以一种更符合用户检索目的的方式提供给用户,例如用户输入“performance”,用户除了希望能获取到包含这个词语的句子,还希望得知句子中 “performance”这个词是如何使用的,而词语的使用方式通常是通过其与句子中的其他词的搭配关系来体现的,而现有的例句检索系统,不能对句子中的搭配信息进行识别,这样就导致与用户需求不够相关的例句检索结果出现在用户浏览页靠前的位置,使得用户为了找到想要的信息不得不进行翻页操作,从而降低了用户的浏览效率,也增加了系统的响应次数。
技术实现思路
本专利技术所要解决的技术问题是提供一种对例句检索结果进行排序的方法和装置, 以解决现有的例句检索系统中存在的影响用户浏览效率,增加系统响应次数的缺陷。本专利技术为解决技术问题而采用的技术方案是提供一种对例句检索结果进行排序的方法,包括A.获取用户的查询词;B.从句库中检索包含所述查询词的匹配例句;C.计算所述查询词与各个匹配例句之间的搭配强度,其中所述查询词与匹配例句之间的搭配强度由所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率确定,词语之间的搭配概率是指词语之间形成搭配关系的可能性;D.按照所述查询词与匹配例句之间的搭配强度的大小对各个匹配例句进行排序。根据本专利技术之一优选实施例,所述句库包括单语句库或双语句库。根据本专利技术之一优选实施例,所述查询词与匹配例句之间的搭配强度等于所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率之和与所述匹配例句包含的词语个数的比值。根据本专利技术之一优选实施例,所述查询词与匹配例句之间的搭配强度等于所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率中最大的N个值之和与N 的比值,其中N为正整数且N小于匹配例句包含的词语个数。根据本专利技术之一优选实施例,所述方法进一步包括对排序后的各个匹配例句进行展不。根据本专利技术之一优选实施例,如果所述句库为双语句库,则在展示排序后的各个匹配例句时,展示各个匹配例句在所述双语句库中互为译文的另一语言的例句。根据本专利技术之一优选实施例,所述方法进一步包括在各个匹配例句中标识与所述查询词之间的搭配概率大于设定阈值的词语,以供标识的词语进行突出显示。根据本专利技术之一优选实施例,所述方法进一步包括E1、确定各个匹配例句中与所述查询词之间的搭配概率大于设定阈值的词语;E2、按照预设的分类策略,对步骤El确定的各词语分别与所述查询词组合形成的各搭配词对进行分类,并在各类别下按照所述搭配词对在所有匹配例句中出现的次数对各搭配词对进行排序并展示。根据本专利技术之一优选实施例,所述分类策略包括将具有相同词性组合的搭配词对分为一个类别;或者,将所述查询词在搭配词对中具有相同词性的搭配词对分为一个类别;或者,将所有的搭配词对分为一个类别。本专利技术还提供了一种对例句检索结果进行排序的装置,包括接收单元,用于获取用户的查询词;检索单元,用于从句库中检索包含所述查询词的匹配例句;计算单元,用于计算所述查询词与各个匹配例句之间的搭配强度,其中所述查询词与匹配例句之间的搭配强度由所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率确定,词语之间的搭配概率是指词语之间形成搭配关系的可能性;排序单元,用于按照所述查询词与所述匹配例句之间的搭配强度的大小对各个匹配例句进行排序。根据本专利技术之一优选实施例,所述句库包括单语句库或双语句库。根据本专利技术之一优选实施例,所述查询词与匹配例句之间的搭配强度等于所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率之和与匹配例句包含的词语个数的比值。根据本专利技术之一优选实施例,所述查询词与匹配例句之间的搭配强度等于所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率中最大的N个值之和与N 的比值,其中N为正整数且小于匹配例句包含的词语个数。根据本专利技术之一优选实施例,该装置还包括展示单元,用于对排序后的各个匹配例句进行展示。根据本专利技术之一优选实施例,如果所述句库为双语句库,所述展示单元在展示排序后的各个匹配例句时,展示各个匹配例句在所述双语句库中互为译文的另一语言的例句。根据本专利技术之一优选实施例,该装置还包括标识单元,用于在各个匹配例句中标识与所述查询词之间的搭配概率大于设定阈值的词语,以供标识的词语进行突出显示。根据本专利技术之一优选实施例,该装置还包括分类单元,用于确定各个匹配例句中与所述查询词之间的搭配概率大于设定阈值的词语并按照预设的分类策略,对确定的各词语分别与所述查询词组合形成的各搭配词对进行分类,在各类别下按照所述搭配词对在所有匹配例句中出现的次数对各搭配词对进行排序;所述展示单元进一步用于展示各类别下经排序后的各搭配词对。根据本专利技术之一优选实施例,所述分类策略包括将具有相同词性组合的搭配词对分为一个类别;或将所述查询词在搭配词对中具有相同词性的搭配词对分为一个类别; 或将所有的搭配词对分为一个类别。由以上技术方案可以看出,通过计算用户的查询词与匹配例句之间的搭配强度, 并根据搭配强度对匹配例句进行排序和展示,能够更好地满足用户的语言学习的目的和需求,提高用户的浏览效率,同时减少了系统为满足用户需求而增加的响应次数。附图说明图1为本专利技术中对例句检索结果进行排序的方法的实施例的流程示意图;图2为本专利技术中例句检索结果的展示界面的实施例一的示意图;图3为本专利技术中例句检索结果的展示界面的实施例二的示意图;图4为本专利技术中对例句检索结果进行排序的装置的实施例的结构示意框图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。请参考图1,图1为本专利技术中对例句检索结果进行排序的方法的实施例的流程示意图。如图1所示,所述方法包括步骤101 获取用户的查询词。步骤102 从句库中检索包含查询词的匹配例句。步骤103 计算查询词与各个匹配例句之间的搭配强度。步骤104 按照查询词与匹配例句之间的搭配强度的大小对各个匹配例句进行排序。步骤105 确定各个匹配例句中与查询词之间的搭配概率大于设定阈值的词语, 并按照预设的分类策略,对确定的各词语分别与查询词组合形成的各搭配词对进行分类, 在各类别下按照搭配词对在所有匹配例句中出现的次数对各搭配词对进行排序。步骤106 展示排序后的各个匹配例句和各类别下经排序后的各搭配词对。下面对上述步骤进行具体说明。用户在进行语言学习时,在查询一个词或多个词时的目的通常是不一样的,在查询一个词的时候,用户希望获得包含该词语的例句,以了解查询词在句子中的用法,而用户在查询多个词时,通常这多个词在使用时是有搭配关系的,用户希望获得包含这几个查询词的例句,同时希望了解这几个查询词之间的搭配关系是如何体现在例句中本文档来自技高网...

【技术保护点】
1.一种对例句检索结果进行排序的方法,其特征在于,所述方法包括:A.获取用户的查询词;B.从句库中检索包含所述查询词的匹配例句;C.计算所述查询词与各个匹配例句之间的搭配强度,其中所述查询词与匹配例句之间的搭配强度由所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率确定,词语之间的搭配概率是指词语之间形成搭配关系的可能性;D.按照所述查询词与匹配例句之间的搭配强度的大小对各个匹配例句进行排序。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘占一吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1