一种基于深度学习与主题模型的技术专利识别方法技术

技术编号:41717297 阅读:11 留言:0更新日期:2024-06-19 12:44
本发明专利技术提供了一种基于深度学习与主题模型的技术专利识别方法,包括以下步骤:步骤S1:获取专利文本集,按照IPC分类号进行分类,得到若干个领域标签集;步骤S2:获取每个专利说明书摘要部分的主题,进行主题分类;步骤S3:基于专利文本集和主题分类结果,识别关键共性技术特征;步骤S4:构建深度学习网络,通过优质专利的文本和关键共性技术特征进行训练,以对待判别专利文本进行识别。能够基于海量专利数据文本,准确快速的识别各个领域高质量优质技术专利。

【技术实现步骤摘要】

本专利技术涉及专利评价,具体涉及一种基于深度学习与主题模型的技术专利识别方法


技术介绍

1、在生产系统中起到关键核心作用的技术不仅涉及到产业链,供应链的安全性,同时兼具了技术性,公共性,社会性和安全性等多维度的特征,在推动经济社会发展,行业技术进步,企业竞争力的提升等多个方面具有重要意义。以领域关键核心作用的技术作为创新点的技术专利的识别与应用是目前知识产权领城的重要研究热点之一。

2、目前,对于技术专利的识别方法主要包括基于采用k-means聚类分析的识别方法和基于大数据的数据挖掘和机器学习方法等传统的分析识别方法,但传统的方法是以专利文本或专利申请文本为研究对象,或只以某一领城为研究范围,基于海量专利数据识别领域高质量优质技术专利的精度和效率较低,无法有效的针对领域内的优质技术专利进行识别。


技术实现思路

1、本专利技术提出了一种基于深度学习与主题模型的技术专利识别方法,以解决现有技术难以对领域外的专利进行优质技术专利识别的技术问题。

2、为解决上述技术问题,本专利技术提供了一种本文档来自技高网...

【技术保护点】

1.一种基于深度学习与主题模型的技术专利识别方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:所述识别方法还包括数据清洗方法:去除摘要缺失的文本;进行分词,过滤标点与数字,同时进行去噪处理:包括小写转化、拼写检查更正、单复数统一、同义词合并、全称和缩写;去除停用词、专有描述词、学术词汇、出现频率高的干扰词和提取词干。

3.根据权利要求1所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:步骤S2中通过文档主题生成模型LDA生成主题。

4.根据权利要求3所述的一种基于深度学习与...

【技术特征摘要】

1.一种基于深度学习与主题模型的技术专利识别方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:所述识别方法还包括数据清洗方法:去除摘要缺失的文本;进行分词,过滤标点与数字,同时进行去噪处理:包括小写转化、拼写检查更正、单复数统一、同义词合并、全称和缩写;去除停用词、专有描述词、学术词汇、出现频率高的干扰词和提取词干。

3.根据权利要求1所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:步骤s2中通过文档主题生成模型lda生成主题。

4.根据权利要求3所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:所述主题生成模型lda的主题数通过以下方法进行确定:

5.根据权利要求1所述的一种基于深度学习与主题模型的技术专利识别方法,其特征在于:步骤s3中通过计算关键共性技术特征评价值对关键共性技术特征进行识别,所述关键共性技术特征评价值的表达式为:

6.根据权利要求5所述的一种基于深度学习与主题模型的技术专利识别方法,其特...

【专利技术属性】
技术研发人员:胡晨宇雷易豪李诗轩
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1