【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,特别地涉及一种例句检索的方法及系统。
技术介绍
随着互联网技术的深入发展,使得人们在写作或语言学习中获得所需的信息更加便利。例句检索辅助用户获取与输入匹配的(双语)例句,从而满足用户了解词的用法或翻译的需求。另外,在机器翻译中,也会用到例句检索从而使得翻译更加精准。截至目前为止,有关例句检索中query (即查询词)与例句相关性计算方法主要有以下几种一是根据例句中匹配的query个数或长度计算;二是根据例句长度及匹配query字符串长度计算;三是根据query与例句的编辑距离计算。如CN 102346777公开了一种对例句检索结果进行排序的方法和装置,其中使用搭配来体现query的用法,但没有综合考虑例句中query的有关句法特征、例句本身的特征等因素,并且搭配概率的计算公式没有考虑query在搭配中所起的作用或所做的成分,搭配概率计算中笼统的采用了统一的计算公式。CN 1471030公开了一种基于加权编辑距离的自动例句检索的系统和方法,其中,通过编辑距离来进行检索,但依然侧重于query的字符串匹配。这几种方法都侧重于词层次的字 ...
【技术保护点】
一种例句检索的方法,其特征在于,包括,获取用户输入的查询词query;在例句库中检索匹配query的例句,并进行所述query与例句的相关性计算;根据用法多样性或翻译多样性原则,进行例句相关性打分调整,进行例句排序;输出例句并展示例句中的短语。
【技术特征摘要】
【专利技术属性】
技术研发人员:杨振东,石志伟,周步恋,车天文,王更生,王喜民,何宏靖,徐忆苏,
申请(专利权)人:深圳市宜搜科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。