【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及关键词提取装置和信息检索装置,特别涉及不需要字典可从文件组中提取关键词的关键词提取装置和信息检索装置。
技术介绍
在整理最新的技术信息速报和新闻等时,为了检索,进行可以鉴定记事内容的关键词的赋予。如果将赋予关键词的作业自动化,则不赋予关键词的文件的操作也变得容易。至今研讨的关键词自动提取采用以下方法使用字典来进行词素解析,然后,根据词类信息和频度信息来识别关键词。但是,作为每天产生新单词的因特网时代的信息处理,使用字典的方法存在问题。作为其理由,可列举出处理自动化因需要从必需的最新文章中将关键词不断登录在字典上而生产性差,以及没有对于字典上未登录的所有未知用语的通用性。此外,在现有的关键词提取方法中,有时未正确地分割为单词,因此,存在单词前后的一部分字符被分割到断开的部分字符串中的问题。此外,还存在助词和助动词包含在单词的前后而被分割的问题。
技术实现思路
本专利技术是用于解决上述课题的专利技术,其目的在于提供一种关键词提取装置,可不需要字典而从文件中提取关键词。本专利技术的另一目的在于提供一种信息检索装置,可不需要字典而从文件组中提取与某个文件相关 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:梅村恭司,武并佳则,岸田正博,
申请(专利权)人:住友电气工业株式会社,梅村恭司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。