【技术实现步骤摘要】
一种技术交底文本扩充方法、装置和设备
本专利技术涉及数据处理领域,特别涉及一种技术交底文本扩充方法、装置和设备。
技术介绍
专利文件是世界上最大的技术信息资源,据统计专利文件包含了世界上90%~95%的科技技术信息,其作为一种无形财产越来越引起人们的重视。例如,2019年我国专利技术专利申请量为140.1万件,共授权专利技术专利45.3万件等。但是截至2019年12月底,全国专利代理机构仅2649家,执业专利代理师突破2万人,虽然与2012年底相比,分别增长了1.9倍和1.5倍。但是相较于专利申请数量与专利代理师人数的悬殊,依然有许多申请人不能及时高效的将自己研发过程中产生的专利技术创造提交到相关部门进行专利申请。对于普通申请人,尤其是专利技术人而言,虽然很清楚专利技术创造的技术方案,但是对于专利的撰写规则和要求却知之甚少,很难独立撰写出合格的申请文件。目前,还没有一种可行的辅助方式,能够帮助那些了解技术方案但专利申请经验不足的申请人形成初步的申请文件,也没有能够帮助缺乏经验的申请人、专利技术人迅速建立起专利撰写文件 ...
【技术保护点】
1.一种技术交底文本扩充方法,其特征在于,包括:/n确定所述技术交底文本中的至少一个可能不具备创新性的段落文本;/n以至少一个所述可能不具备创新性的段落文本中包含的至少一个检索语句为检索对象,在预先建立的检索数据库中进行检索,确定检索到的相似语句和/或相似段落文本与所述检索语句的相似度值;/n将所述相似度值与预设的相似度阈值进行比较,将相似度值高于相似度阈值的相似段落文本和/或相似语句,作为与所述可能不具备创新性的段落文本相似的参考文本,添加到所述技术交底文本中。/n
【技术特征摘要】
20200319 CN 202010196520X1.一种技术交底文本扩充方法,其特征在于,包括:
确定所述技术交底文本中的至少一个可能不具备创新性的段落文本;
以至少一个所述可能不具备创新性的段落文本中包含的至少一个检索语句为检索对象,在预先建立的检索数据库中进行检索,确定检索到的相似语句和/或相似段落文本与所述检索语句的相似度值;
将所述相似度值与预设的相似度阈值进行比较,将相似度值高于相似度阈值的相似段落文本和/或相似语句,作为与所述可能不具备创新性的段落文本相似的参考文本,添加到所述技术交底文本中。
2.根据权利要求1中所述的方法,其特征在于:
以所述可能不具备创新性的段落文本中包含的至少一个检索语句为检索对象,在预先建立的检索数据库中进行检索,之前还包括:
对至少一个所述检索语句进行向量化处理,得到检索语句向量;
以所述可能不具备创新性的段落文本中包含的至少一个检索语句为检索对象,在预先建立的检索数据库中进行检索,确定检索到的相似语句和/或相似段落文本与所述检索语句的相似度值,包括:
以所述检索语句向量为检索对象,在预先建立的检索数据库中进行检索,得到相似语句和/或相似段落文本,并根据计算出的相似语句和/或相似段落文本与所述检索语句相似度距离,确定所述相似语句和/或相似段落文本与所述检索语句的相似度值。
3.根据权利要求2所述的方法,其特征在于,以所述检索语句向量为检索对象,在预先建立的检索数据库中进行检索,确定所述相似语句和/或相似段落文本与所述检索语句的相似度值,包括:
以所述检索语句向量作为检索对象的输入,根据预设的索引方式确定所述检索语句向量在所述检索数据库中的条目;
计算所述条目和相邻条目中所有语句向量与所述检索语句向量的相似度距离;
将得到的所述相似度距离按照从小到大进行排序,并获取排序结果中预设数量的相似度距离小的相似语句对应的相似度距离;
将所述相似语句和/或所述相似段落文本与所述检索语句的相似度距离转换为相似度值。
4.根据权利要求2所述的方法,其特征在于,对至少一个所述检索语句进行向量化处理,得到检索语句向量,包括:
对所述检索语句按照预设的分词方法进行分词处理,并将所述分词进行向量化处理得到分词向量;
以所述分词向量、所述分词在所述技术交底文本中的词频以及逆文档频率,进行加权求和后得到所述检索语句向量。
5.根据权利要求1所述的方法,其特征在于,将相似度值高于相似度阈值的相似段落文本和/或相似语句,作为与所述可能不具备创新性的段落文本相似的参考文本,添加到所述技术交底文本中,包括:
将相似度值高于相似度阈值的相似段落文本和/或相似语句,作为与所述可能不具备创新性的段落文本相似的参考文本,所述参考文本以下述任一项或多项方式与所述可能不具备创新性的段落文本进行关联,添加到所述技术交底文本中:
批注方式、标注方式、修订方式和注释方式。
6.根据权利要求1~5中任一项所述的方法,其特征在于,所述确定所述技术交底文本中的至少一个可能不具备创新性的段落文本,包括:
判断所述技术交底文本中的段落文本是否标记有不具备创...
【专利技术属性】
技术研发人员:刘恺,张灏,李强,
申请(专利权)人:北京信聚知识产权有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。