【技术实现步骤摘要】
专利分类方法及装置
本专利技术实施例涉及计算机
,更具体地,涉及一种专利分类方法及装置。
技术介绍
按照技术主题设立类目,专利涉及的整个
分为5个不同等级:部、大类、小类、大组和小组。在专利申请过程中,根据提交的专利交底书中的技术描写,根据人工的经验进行IPC分类,由人工方式通过对专利文本技术方案的理解确定该专利交底书应该属于哪个部,哪个大类、小类、大组小组。基于深度学习技术的专利分类,可以通过不同分类的语料数据,进行训练文本分类模型,再利用训练后的模型对新的文本进行自动判断,给出新文本的专利IPC类型。该模型包括多个子模型,分别用于判断新的文本是否属于某个小组。由于目前小组的总数经超过6万数量,如果平均每个小组训练语料采用1000篇,那么需要的语料篇章总数量达6000万篇,几乎达到全球已有专利数量的一半,无论是对于语料还是对于服务器都是巨大的负荷。因此,现有方法存在效率低、模型训练复杂及需要较多的硬件资源(例如服务器的负荷)等不足。
技术实现思路
本专利技术实施例提供一种专利 ...
【技术保护点】
1.一种专利分类方法,其特征在于,包括:/n根据文本特征提取方法,获取待分类的专利文本的文本特征;/n将所述文本特征输入至训练好的专利分类模型,输出所述专利文本的专利分类结果;/n其中,所述专利分类模型包括五层,每层包括若干个子模型;各所述子模型的层级关系与专利分类的技术领域、部、大类、小类和大组的层级关系相对应;每一所述子模型,是根据样本专利文本及预先获取的所述样本专利文本的标签进行训练后获得的。/n
【技术特征摘要】
1.一种专利分类方法,其特征在于,包括:
根据文本特征提取方法,获取待分类的专利文本的文本特征;
将所述文本特征输入至训练好的专利分类模型,输出所述专利文本的专利分类结果;
其中,所述专利分类模型包括五层,每层包括若干个子模型;各所述子模型的层级关系与专利分类的技术领域、部、大类、小类和大组的层级关系相对应;每一所述子模型,是根据样本专利文本及预先获取的所述样本专利文本的标签进行训练后获得的。
2.根据权利要求1所述的专利分类方法,其特征在于,所述将所述文本特征输入至训练好的专利分类模型,输出所述专利文本的专利分类结果的具体步骤包括:
将所述文本特征输入至所述专利分类模型的第一层子模型,输出所述专利文本所属的部;
将所述文本特征输入至所述专利文本所属的部对应的第二层子模型,输出所述专利文本所属的大类;
将所述文本特征输入至所述专利文本所属的大类对应的第三层子模型,输出所述专利文本所属的小类;
将所述文本特征输入至所述专利文本所属的小类对应的第四层子模型,输出所述专利文本所属的大组;
将所述文本特征输入至所述专利文本所属的大组对应的第五层子模型,输出所述专利文本所属的小组。
3.根据权利要求1所述的专利分类方法,其特征在于,所述子模型为基于卷积神经网络建立的模型。
4.根据权利要求1至3任一所述的专利分类方法,其特征在于,所述将所述文本特征输入至训练好的专利分类模型,输出所述专利文本的专利分类结果之前,还包括:
根据专利分类的技术领域、部、大类、小类和大组,建立所述专利分类模型;
根据每一所述子模型在所述专利分类模型中的位置,确定用于训练所述子模型的样本专利文本;
根据用于训练所述子模型的样本专利文本及其标签,对所述子模型进行训练。
5.一种专利分类装置,其特征在于,包括:
特征提取模块,用于根据文本特征提取方法,获取待分类的专利文本的文本特征;
专利分类模块,用于将所述文本特征输入至训...
【专利技术属性】
技术研发人员:汪术文,高翊,程国艮,
申请(专利权)人:中译语通科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。