术语抽取方法和装置制造方法及图纸

技术编号:7271016 阅读:182 留言:0更新日期:2012-04-15 17:23
本发明专利技术公开了一种用于抽取术语的方法和装置。该方法包括:获取候选术语的至少两个特征;基于所获取的特征对候选术语进行抽取;其中所述特征包括头尾词或字特征以及指示词特征。

【技术实现步骤摘要】

本专利技术涉及文字处理领域。特别地,本专利技术涉及一种术语抽取方法和装置
技术介绍
术语是用于表示一个领域的最基础的知识的词汇单元。抽取术语的目的在于提取有意义的词或短语,该词或者短语表示特定于该领域的含义或者概念。由于利用术语抽取的结果可以对文本进行快速分析,因此本领域技术人员对术语抽取进行了广泛研究。
技术实现思路
本专利技术的一个目的是,提供一种用于抽取术语的方法和装置。在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。根据本专利技术的实施例,获取候选术语的至少两个特征,并基于所获取的特征对候选术语进行抽取;其中所述特征包括头尾词或字特征以及指示词特征。借助根据本专利技术的实施例,可以有效地改进术语抽取结果,并且可以根据实际应用的具体情况利用不同的特征来进行术语抽取,从而提高所抽取的术语的准确性。通过以下结合附图对本专利技术的最佳实施例的详细说明本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:杨宇航于浩孟遥陆应亮夏迎炬
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术