内容的分类方法及分类模型的生成方法技术

技术编号:29419341 阅读:19 留言:0更新日期:2021-07-23 23:13
本发明专利技术提供一种进行内容分类的分类模型。一种内容分类方法,包括学习内容及内容,给学习内容添加第一特征量及学习标签,给内容添加第二特征量,并且包括如下步骤:通过机械学习利用多个学习内容生成多个第一分类模型的步骤;利用多个第一分类模型生成第二分类模型的步骤;以及利用第二分类模型给多个内容添加判定信息且将其显示在GUI上的步骤。判定信息包括分类标签或分数。注意,在GUI中,可以指定分数中的特定数值范围,列出显示相应内容。注意,内容被添加的特征量是管理参数(元信息)。

【技术实现步骤摘要】
【国外来华专利技术】内容的分类方法及分类模型的生成方法
本专利技术的一个方式涉及一种利用计算机设备的内容分类方法、内容分类系统、分类模型的生成方法以及图形用户界面。另外,本专利技术的一个方式涉及一种计算机设备。本专利技术的一个方式涉及一种利用计算机设备的电子化内容(文字数据、图像数据、音频数据或视频数据)分类方法。尤其是,本专利技术的一个方式涉及一种利用机械学习基于内容集合高效地进行分类的内容分类系统。另外,本专利技术的一个方式涉及一种利用计算机设备使用程序管理的图形用户界面的内容分类方法、内容分类系统以及分类模型的生成方法。
技术介绍
用户想从内容集合容易分类并提取与用户所指定的题目有关的信息。但是,当从大量内容中分类符合目的条件的内容时,基于个人的知识或经验等而内容分类结果有差异。近年来,有如下提案:将根据个人的知识或经验分类的内容分类结果作为监督数据提供给计算机设备,使其机械学习内容分类方法。例如,专利文献1公开了用来决定与用户所指定的题目之间的相关性高的文档的机械学习的研究。[先行技术文献][专利文献][专利文献1]日本专利申请公开第2009-104630号公报
技术实现思路
专利技术所要解决的技术问题有时按照目的对某个内容集合进行分类。在本专利技术的一个方式中,说明内容为专利的情况。专利都被分配特有的专利号。因此,以下有时将内容换称为专利号而进行说明。注意,在本专利技术的一个方式中说明的内容分类方法中,着眼于分配到专利号的多个管理参数。注意,内容不局限于专利文献。内容也可以是文字数据、图像数据、音频数据或视频数据等信息。利用各种元信息管理内容。元信息不是指某个内容本身,而是记述该内容所属的属性或相关信息的数据。作为一个例子,将权利要求书、说明书摘要、附图及说明书作为内容之内容与专利号相关联。并且,专利号被添加元信息(评价信息、经过天数、同族信息等)并使用元信息受管理。通过利用元信息进行基于重要性的专利号分类。分类的精度或效率根据作为对象的文件的内容而不同但是易于产生基于用户的经验或熟练程度的差异,并且需要对大量文件进行分类,因此在效率化方面有问题。在利用机械学习的分类模型的生成中,需要准备大量的学习数据,因此有用户的负担过重的问题。有包括在学习数据中的分类内容数量的不均匀给分类模型的精度带来影响的问题。鉴于上述问题,本专利技术的一个方式的目的之一是提供一种高效地生成分类模型且使用其进行信息分类的方法。另外,本专利技术的一个方式的目的之一是提供一种用来交互地生成分类模型的图形用户界面。另外,本专利技术的一个方式的目的之一是提供一种进行概率高的信息的分类的程序。注意,这些目的的记载不妨碍其他目的的存在。本专利技术的一个方式并不需要实现所有上述目的。此外,上述以外的目的是可以从说明书、附图及权利要求书等的记载中自然得知并衍生出来的。解决技术问题的手段计算机设备所包括的存储装置储存有程序。程序可以通过图形用户界面(以下,GUI)使计算机设备所包括的显示装置显示各种信息。此外,用户可以通过GUI使计算机设备进行程序的操作、信息添加、响应数据库、机械学习的指令等。另外,程序可以通过GUI将利用机械学习的运算处理结果、从数据库下载的学习内容或未分类内容的内容等显示在显示装置上。注意,以下,简单地记载为“内容”的情况下,包括学习内容、未分类内容或已分类内容。所提案的内容分类系统利用机械学习生成内容的分类模型,利用所生成的内容的分类模型对未分类内容进行分类。例如,将包括多个元信息的内容作为学习内容。而且,当学习内容被添加学习标签时从学习内容生成特征向量。注意,在生成特征向量的情况下,可以将元信息或学习标签用作学习内容的特征量。学习内容被用作监督数据。分类模型可以基于学习内容进行机械学习来取得。在此得到的分类模型进行包括多个元信息的内容的分类。根据用户的目的分类种类可以是两种,也可以是三种以上。与通过手工或目视进行所有文件的判断的情况相比,用户通过利用分类模型可以以更短的时间进行整个文件的分类。可以从储存在数据库中的学习内容下载学习内容。或者,可以使用储存在计算机设备的存储装置中的学习内容。注意,学习内容也可以包括学习标签而受管理。并且,也可以下载储存在数据库中的分类模型。或者,也可以使用储存在计算机设备的存储装置中的分类模型。本专利技术的一个方式是一种内容分类方法,包括学习内容及内容,给学习内容添加第一特征量及学习标签,给内容添加第二特征量,并且包括如下步骤:通过机械学习利用多个学习内容生成多个第一分类模型的步骤;利用多个第一分类模型生成第二分类模型的步骤;以及利用第二分类模型给多个内容添加判定信息且将其显示在图形用户界面上的步骤。本专利技术的一个方式是一种内容分类方法,包括学习内容及内容,给学习内容添加第一特征量及学习标签,给内容添加第二特征量,并且包括如下步骤:通过机械学习利用多个学习内容生成多个第一分类模型的步骤;从多个第一分类模型的输出计算出平均值的步骤;利用多个平均值生成第二分类模型的步骤;以及利用第二分类模型给多个内容添加判定信息且将其显示在图形用户界面上的步骤。本专利技术的一个方式是一种内容分类方法,包括学习内容及内容,给学习内容添加第一特征量及学习标签,给内容添加第二特征量,并且包括如下步骤:通过机械学习利用多个学习内容生成多个第一分类模型的步骤;多个第一分类模型中的每一个基于第一评价标准进行评价的步骤;多个第一分类模型中的每一个基于第二评价标准进行评价的步骤;根据基于多个第一评价标准的评价结果和基于第二评价标准的评价结果生成第二分类模型的步骤;以及利用第二分类模型给多个内容添加判定信息且将其显示在图形用户界面上的步骤。在具有上述各结构的内容分类方法中,优选第一评价标准为精度(Precision)且第二评价标准为灵敏度(Sensitivity)。在具有上述各结构的内容分类方法中,优选包括利用任意学习内容生成第一分类模型的步骤。在具有上述各结构的内容分类方法中,优选的是,学习内容还被添加分类信息,包括利用第二分类模型的输出从添加有分类标签的多个内容中选择包括与分类信息相同的判定信息的内容且将其显示在图形用户界面上的步骤。在具有上述各结构的内容分类方法中,添加到学习内容及内容的特征量优选为管理参数。在具有上述各结构的内容分类方法中,判定信息优选包括分类标签或分数。在具有上述结构的内容分类方法中,优选的是,包括图形用户界面指定分数中的特定数值范围并列出显示相应内容的步骤。专利技术效果本专利技术的一个方式可以提供一种以高精度进行信息分类的方法。另外,本专利技术的一个方式可以提供一种以高精度进行信息分类的用户界面。另外,本专利技术的一个方式可以提供一种以高精度进行信息分类的程序。另外,本专利技术的一个方式可以给用户提供一种用来生成利用机械学习的分类模型的交互式界面,可以减轻监督数据的准备或学习结果的评价等用户的负担。注意,本专利技术的一个方式的效果不局限于上述效果。上述效果并不妨碍其他效果的存在。另外,其他效果是本文档来自技高网...

【技术保护点】
1.一种内容分类方法,包括:/n学习内容及内容,/n其中,给所述学习内容添加第一特征量及学习标签,/n给所述内容添加第二特征量,/n并且,包括如下步骤:/n通过机械学习利用多个所述学习内容生成多个第一分类模型的步骤;/n利用所述多个第一分类模型生成第二分类模型的步骤;以及/n利用所述第二分类模型给多个所述内容添加判定信息且将其显示在图形用户界面上的步骤。/n

【技术特征摘要】
【国外来华专利技术】20181213 JP 2018-2330371.一种内容分类方法,包括:
学习内容及内容,
其中,给所述学习内容添加第一特征量及学习标签,
给所述内容添加第二特征量,
并且,包括如下步骤:
通过机械学习利用多个所述学习内容生成多个第一分类模型的步骤;
利用所述多个第一分类模型生成第二分类模型的步骤;以及
利用所述第二分类模型给多个所述内容添加判定信息且将其显示在图形用户界面上的步骤。


2.一种内容分类方法,包括:
学习内容及内容,
其中,给所述学习内容添加第一特征量及学习标签,
给所述内容添加第二特征量,
并且,包括如下步骤:
通过机械学习利用多个所述学习内容生成多个第一分类模型的步骤;
从所述多个第一分类模型的输出计算出平均值的步骤;
利用所述多个平均值生成第二分类模型的步骤;以及
利用所述第二分类模型给多个所述内容添加判定信息且将其显示在图形用户界面上的步骤。


3.一种内容分类方法,包括:
学习内容及内容,
给所述学习内容添加第一特征量及学习标签,
给所述内容添加第二特征量,
并且,包括如下步骤:
通过机械学习利用多个所述学习内容生成多个第一分类模型的步骤;
所述多个第一分类模型中的每一个基于第...

【专利技术属性】
技术研发人员:桃纯平福留贵浩
申请(专利权)人:株式会社半导体能源研究所
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1