【技术实现步骤摘要】
本专利技术涉及文字处理领域。特别地,本专利技术涉及一种术语抽取方法和装置。
技术介绍
术语是用于表示一个领域的最基础的知识的词汇单元。抽取术语的目的在于提取有意义的词或短语,该词或者短语表示特定于该领域的含义或者概念。由于利用术语抽取的结果可以对文本进行快速分析,因此本领域技术人员对术语抽取进行了广泛研究。
技术实现思路
本专利技术的一个目的是,提供一种用于抽取术语的方法和装置。在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。根据本专利技术的实施例,获取候选术语的至少两个特征,并基于所获取的特征对候选术语进行抽取;其中所述特征包括头尾词或字特征以及指示词特征。借助根据本专利技术的实施例,可以有效地改进术语抽取结果,并且可以根据实际应用的具体情况利用不同的特征来进行术语抽取,从而提高所抽取的术语的准确性。通过以下结合附图对本专利技术的 ...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:杨宇航,于浩,孟遥,陆应亮,夏迎炬,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。