【技术实现步骤摘要】
本专利技术属于信息处理,具体涉及一种文本分类技术。
技术介绍
1、
2、许多研究人员已经提出了各种各样的基于机器学习和深度学习的方法来解决这个问题,但现有技术对专利文献的授权预测专注于预测对象本身,并不能充分利用已公开的授权信息,从而导致预测的准确率下降。
技术实现思路
1、本专利技术为解决现有专利审查过程中存在的无法全面检索并使用与专利文献相关的公开的现有技术从而导致预测的准确率下降的问题。
2、一种专利授权预测方法,所述方法包括:
3、根据待测专利文献的说明书,获取待测专利文献的摘要,对所述专利文献的摘要的文本进行向量化,得到所述摘要的向量;
4、根据所述摘要的向量,计算待测专利文献的余弦和公开专利文献数据集的余弦相似度;
5、选取n篇与待测专利文献的余弦相似度最高的公开专利文献;
6、采用bert模型训练所述待测专利文献和选取出的公开专利文献,得到处理后文本和选取出的公开专利文献的向量表示;
7、采集
...【技术保护点】
1.一种专利授权预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种专利授权预测方法,其特征在于,利用TF-IDF进行向量化。
3.根据权利要求1所述的一种专利授权预测方法,其特征在于,10≦N≦20。
4.根据权利要求1所述的一种专利授权预测方法,其特征在于,所述选取出的公开专利文献的主题采用K-Means和基于类的TF-IDF提取。
5.根据权利要求1所述的一种专利授权预测方法,其特征在于,采用BERT模型训练所述待测专利文献和选取出的公开专利文献包括:对所述待测专利文献和选取出的公开专利文献进行预处理
...【技术特征摘要】
1.一种专利授权预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种专利授权预测方法,其特征在于,利用tf-idf进行向量化。
3.根据权利要求1所述的一种专利授权预测方法,其特征在于,10≦n≦20。
4.根据权利要求1所述的一种专利授权预测方法,其特征在于,所述选取出的公开专利文献的主题采用k-means和基于类的tf-idf提取。
5.根据权利要求1所述的一种专利授权预测方法,其特征在于,采用bert模型训练所述待测专利文献和选取出的公开专利文献包括:对所述待测专利文献和选取出的公开专利文献进行预处理,所述预处理包括:去停用词和标点符号。
6.根据权利要求5所述的一种专利授权预测方法,其特征在于,所述预处理还包括:将b...
【专利技术属性】
技术研发人员:杨沐昀,刘勐,何明睿,曹海龙,徐冰,朱聪慧,赵铁军,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。