基于上下文的首字母缩略词和缩写词的歧义消除制造技术

技术编号:8983310 阅读:291 留言:0更新日期:2013-08-01 02:04
基于上下文的首字母缩略词和/或缩写词的歧义消除可以确定收到的段落中的目标缩写词以及出现在该目标缩写词的上下文中的一个或多个关键词,该目标缩写词表示一个或多个单词的缩写形式。可以生成包含目标缩写词以及一个或多个关键词的上下文搜索查询。通过调用该上下文搜索查询,可以搜索用于目标缩写词的一个或多个扩展的伪文档索引,该伪文档索引包含一个或多个伪文档的索引、关联的一个或多个缩写词以及关联的上下文关键词。基于对伪文档索引的搜索,可以返回与目标缩写词关联的一个或多个伪文档。

【技术实现步骤摘要】
【国外来华专利技术】
本公开一般涉及计算机、计算机应用、人工智能和自然语言处理,且更具体而言涉及首字母缩略词和/或缩写词的歧义消除。
技术介绍
首字母缩略词和缩写词是单词或常见短语的缩写形式。缩写词是用于代表整个单词或短语的缩写或缩略形式(例如,Dr表示“Doctor”或“Drive”,等)。首字母缩略词是由其他单词的起始字母构成的缩写词且有时候发音为单词(例如IBM)。对于首字母缩略词和缩写词两者都存在的理解目标含义的问题,在于它们具有多于一个并且有时候具有很多个可能的扩展。这带来了在实际想要的扩展方面的歧义。上下文是人类读者理解扩展的目标含义的背景。例如,首字母CIA具有很多可能的扩展,其中两个众所周知的扩展是Central Intelligence Agency(中央情报局)和Culinary Instituteof America (美国烹饪学院)。在下面的句子中:“The former CIA officer accused of revving an electric drill nearthe head of imprisoned terror suspect has returned t本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:B·K·博古拉夫J·舒卡罗尔D·A·弗鲁茨A·T·莱瓦斯J·M·普拉格尔
申请(专利权)人:国际商业机器公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1