一种专利授权率预测方法、系统、设备及存储介质技术方案

技术编号:40057902 阅读:34 留言:0更新日期:2024-01-16 22:13
一种专利授权率预测方法、系统、设备及存储介质,属于信息处理技术领域,解决现有专利审查过程中存在的无法全面检索并使用与专利相关的公开的现有技术从而导致预测的准确率下降的问题。所述方法包括:获取待测专利文献的摘要,对摘要文本进行向量化,得到摘要的向量;计算待测专利文献的余弦和公开专利数据集的余弦相似度;选取N篇与待测专利文献的余弦相似度最高的公开专利,并对其于待测专利文献进行训练,得到处理后文本和选取出的公开专利的向量表示;采集公开专利文献的主题;计算公开专利文献与其主题向量的距离,作为数据分布表示;通过卷积层、池化层和全连接层获得专利授权预测结果。本发明专利技术适用于专利授权率的预测场景。

【技术实现步骤摘要】

本专利技术属于信息处理,具体涉及一种文本分类技术。


技术介绍

1、

2、许多研究人员已经提出了各种各样的基于机器学习和深度学习的方法来解决这个问题,但现有技术对专利文献的授权预测专注于预测对象本身,并不能充分利用已公开的授权信息,从而导致预测的准确率下降。


技术实现思路

1、本专利技术为解决现有专利审查过程中存在的无法全面检索并使用与专利文献相关的公开的现有技术从而导致预测的准确率下降的问题。

2、一种专利授权预测方法,所述方法包括:

3、根据待测专利文献的说明书,获取待测专利文献的摘要,对所述专利文献的摘要的文本进行向量化,得到所述摘要的向量;

4、根据所述摘要的向量,计算待测专利文献的余弦和公开专利文献数据集的余弦相似度;

5、选取n篇与待测专利文献的余弦相似度最高的公开专利文献;

6、采用bert模型训练所述待测专利文献和选取出的公开专利文献,得到处理后文本和选取出的公开专利文献的向量表示;

7、采集所述选取出的公开专利本文档来自技高网...

【技术保护点】

1.一种专利授权预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种专利授权预测方法,其特征在于,利用TF-IDF进行向量化。

3.根据权利要求1所述的一种专利授权预测方法,其特征在于,10≦N≦20。

4.根据权利要求1所述的一种专利授权预测方法,其特征在于,所述选取出的公开专利文献的主题采用K-Means和基于类的TF-IDF提取。

5.根据权利要求1所述的一种专利授权预测方法,其特征在于,采用BERT模型训练所述待测专利文献和选取出的公开专利文献包括:对所述待测专利文献和选取出的公开专利文献进行预处理,所述预处理包括:去...

【技术特征摘要】

1.一种专利授权预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种专利授权预测方法,其特征在于,利用tf-idf进行向量化。

3.根据权利要求1所述的一种专利授权预测方法,其特征在于,10≦n≦20。

4.根据权利要求1所述的一种专利授权预测方法,其特征在于,所述选取出的公开专利文献的主题采用k-means和基于类的tf-idf提取。

5.根据权利要求1所述的一种专利授权预测方法,其特征在于,采用bert模型训练所述待测专利文献和选取出的公开专利文献包括:对所述待测专利文献和选取出的公开专利文献进行预处理,所述预处理包括:去停用词和标点符号。

6.根据权利要求5所述的一种专利授权预测方法,其特征在于,所述预处理还包括:将b...

【专利技术属性】
技术研发人员:杨沐昀刘勐何明睿曹海龙徐冰朱聪慧赵铁军
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1