文献分类装置制造方法及图纸

技术编号:24767069 阅读:40 留言:0更新日期:2020-07-04 11:58
本发明专利技术的文献分类装置(10)包括:获取对于各文献预先被分别赋予了基于多观点分类的分类代码的被分类文献集合的信息的单元(22);对于被分类文献集合的各文献分别生成以对被分类文献集合赋予的所有类型或者一部分类型的该分类代码为各元素的多维的特征量向量的单元(23),使用各文献的特征量向量,将被分类文献集合分类的分类单元(24);和生成表示分类的结果的文献分类信息的生成单元(25)。

Document classification device

【技术实现步骤摘要】
【国外来华专利技术】文献分类装置
本专利技术涉及将文献分类的技术。
技术介绍
关于专利申请授权公告、注册技术公告、专利申请公开公告、日本申请的国际申请公开公告这些专利或者技术涉及的文献(以下总称为专利文献),标注了国际专利分类(IPC)、FI记号、F词条这些分类代码。此外,对于日本特许厅运用的计算机软件数据库(CSDB)中积累的各种文献标注了称为CS词条的分类代码,也有社内技术报告等的在各公司标注独自的分类代码来进行管理的文献。存在利用对这样的文献标注的分类代码来检索文献的各种方法。在下述专利文献1中,为了研究者或开发者容易地进行专利文献等的工业产权相关的文献的检索,而公开了一种辅助方法。在该方法中,从将使用者输入的公告号作为检索关键字的检索结果中提取主题代码和F词条进行提示,由此使得使用F词条的检索容易化。在下述专利文献2中,公开了通过活用分类代码进行统计处理,能够在短时间内简便地分析大量的专利文献所属的
的方法。该方法提取对各个专利文献所赋予的多个分类代码,从所提取的分类代码的集合选出数值分析用分类代码,通过数值分析计算出数值分析本文档来自技高网...

【技术保护点】
1.一种文献分类装置,其特征在于,包括:/n获取被分类文献集合的信息的文献集合获取单元,其中,所述被分类文献集合的各文献被预先分别赋予基于多观点分类的分类代码;/n对所述被分类文献集合的各文献分别生成多维的特征量向量的向量生成单元,其中,所述多维的特征量向量以对所述被分类文献集合赋予的所有类型或者一部分类型的所述分类代码为各元素;/n分类单元,其使用所述被分类文献集合的各文献的特征量向量,将所述被分类文献集合分类;和/n生成单元,其生成表示所述分类的结果的文献分类信息。/n

【技术特征摘要】
【国外来华专利技术】1.一种文献分类装置,其特征在于,包括:
获取被分类文献集合的信息的文献集合获取单元,其中,所述被分类文献集合的各文献被预先分别赋予基于多观点分类的分类代码;
对所述被分类文献集合的各文献分别生成多维的特征量向量的向量生成单元,其中,所述多维的特征量向量以对所述被分类文献集合赋予的所有类型或者一部分类型的所述分类代码为各元素;
分类单元,其使用所述被分类文献集合的各文献的特征量向量,将所述被分类文献集合分类;和
生成单元,其生成表示所述分类的结果的文献分类信息。


2.如权利要求1所述的文献分类装置,其特征在于:
还包括对所述被分类文献集合的各文献进行规定字符串的检索的字符串检索单元,
所述向量生成单元生成还包含与所述规定字符串的检索结果对应的元素的所述特征量向量。


3.如权利要求1或2所述的文献分类装置,其特征在于:
对所述被分类文献集合的各文献,除所述分类代码之外,还分别赋予基于将文献内容的主题总括地分类的其它分类的其它分类代码,
所述向量生成单元生成作为元素还包含对所述被分类文献集合赋予的所有类型或者一部分类型的所述其它分类代码的所述特征量向量。


4.如权利要求1~3中任一项所述的文献分类装置,其特征在于:
所述向量生成单元,
对所述被分类文献集合的各文献分别生成第一特征量向量,其中,所述第一特征量向量以对所述被分类文献集合赋予的一部分类型的分类代码为各元素,并且,
进一步对所述被分类文献集合或者一部分所述被分类文献集合的各文献分别生成第二特征量向量,其中,所述第二特征量向量以其余的分类代码中的至少一部分类型的分类代码为各元素,
所述分类单元,
使用所述第一特征量向量对所述被分类文献集合进行第一分类,并且,
进一步使用所述第二...

【专利技术属性】
技术研发人员:山口真主安藤俊幸长原进介
申请(专利权)人:花王株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1