一种基于自然语言算法的专利撰写质量核检方法以及系统技术方案

技术编号:36026846 阅读:12 留言:0更新日期:2022-12-21 10:25
本申请涉及一种基于自然语言算法的专利撰写质量核检方法以及系统,涉及文档审核技术领域,解决了专利文档只有上传至质检工具才能进行质量检测,不仅降低了专利工程师发现撰写错误的效率,而且还可能导致专利文档中多次出现同样的错误,导致后续修改耗时增加的问题,其包括:获取专利撰写信息;根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告,其中,专利撰写信息的审核评估方向包括通顺度审核评估、错别字检测审核评估、去重审核评估;显示审核评估报告。本申请具有如下效果:方便专利处理人员及时查找到问题并完成修改,间接提高了专利处理人员完结案件处理的效率。的效率。的效率。

【技术实现步骤摘要】
一种基于自然语言算法的专利撰写质量核检方法以及系统


[0001]本申请涉及文档审核
,尤其是涉及一种基于自然语言算法的专利撰写质量核检方法以及系统。

技术介绍

[0002]专利一般是由政府机关或者代表若干国家的区域性组织根据申请而颁发的一种文件,这种文件记载了专利技术创造的内容,并且在一定时期内产生这样一种法律状态,即获得专利的专利技术创造在一般情况下他人只有经专利权人许可才能予以实施。专利一般分为专利技术、技术和外观设计三种类型。
[0003]对于专利技术和技术专利而言,其一般是通过文字和附图的记载来限定专利的保护范围,以及对专利技术进行详细的介绍,并且专利作为法律文件也需要有一定的准确性保障。专利一般由人工撰写,难免会出现各种错误,因此,对专利文档进行自动化审核或辅助撰写,成为了亟待解决的问题。
[0004]相关技术中,专利撰写质量的质检需要在完成专利撰写后,将专利文档上传到质检工具中进行质量检测。
[0005]针对上述中的相关技术,专利技术人发现存在有如下缺陷:由于专利文档只有上传至质检工具才能进行质量检测,不仅降低了专利工程师发现撰写错误的效率,而且还可能导致专利文档中多次出现同样的错误,导致后续修改耗时增加。

技术实现思路

[0006]为了方便专利处理人员及时查找到问题并完成修改,间接提高了专利处理人员完结案件处理的效率,本申请提供一种基于自然语言算法的专利撰写质量核检方法以及系统。
[0007]第一方面,本申请提供一种基于自然语言算法的专利撰写质量核检方法,采用如下的技术方案:一种基于自然语言算法的专利撰写质量核检方法,包括:获取专利撰写信息;根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告,其中,专利撰写信息的审核评估方向包括通顺度审核评估、错别字检测审核评估、去重审核评估;显示审核评估报告。
[0008]通过采用上述技术方案,能够在专利处理人员处理专利文件的时候,对专利文件作各方面的审核评估,并及时展示审核评估报告,节省了审核人力,方便专利处理人员及时查找到问题并完成修改,间接提高了专利处理人员完结案件处理的效率。
[0009]可选的,若专利撰写信息的审核评估方向为通顺度审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:
用文本增强方法构建多个正负样本;用正负样本训练分类模型,获取段落/句子的通顺度;根据段落/句子的通顺度,形成审核评估报告。
[0010]通过采用上述技术方案,在针对专利撰写信息作通顺度审核评估的时候,通过正负样本的构建以及用正负样本训练分类模型的方式,可以有效分析判断段落/句子是否通顺,并获取通顺度,从而间接减少专利撰写信息中存在句子不通顺情况的发生。
[0011]可选的,若专利撰写信息的审核评估方向为错别字检测审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:用掩码语言模型分析判断每个字的合理性;根据所分析判断每个字的合理性,形成审核评估报告。
[0012]通过采用上述技术方案,在针对专利撰写信息作错别字检测审核评估的时候,通过掩码语言模型可以有效分析每个字的合理性,从而间接减少专利撰写信息中存在不合理字的可能性。
[0013]可选的,若专利撰写信息的审核评估方向为单独去重审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:基于simhash功能从历史专利中检索出完全相似的专利;基于语义向量检索出语义上最接近的专利;根据从历史专利中检索出完全相似的专利以及语义向量检索出语义上最接近的专利,分析获取与专利撰写信息的相似度,形成审核评估报告。
[0014]通过采用上述技术方案,在针对专利撰写信息作单独去重审核评估的时候,通过simhash功能以及语义向量检索的方式,可以作有效单独去重审核评估。
[0015]可选的,专利撰写信息的获取包括:获取专利撰写信息的整体审核评估报告;根据预设的专利撰写信息不同审核评估方向的准确率和分值占比,分析获取审核评估分数;若审核评估分数小于预设的第一审核评估分数,则实时获取专利撰写信息;若审核评估分数大于等于预设的第一审核评估分数,则根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息。
[0016]通过采用上述技术方案,可以有效对专利撰写信息作整体审核评估并得到审核评估分数,在审核评估分数较低的时候,作专利撰写信息的实时获取,而在审核评估分数达到预期分数的情况下,则会根据预设的专利撰写信息获取方式来获取专利撰写信息,从而满足问题较少的专利处理人员。
[0017]可选的,根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息包括:查询用户预设的专利撰写信息获取方式优先级,其中,专利撰写信息获取方式包括根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息;若查询到,则将优先级高的专利撰写信息获取方式,作为本次所使用的专利撰写
信息获取方式;反之,则根据用户历史选用不同专利撰写信息获取方式的审核评估分数的变化情况,分析审核评估分数增长速度最快的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式。
[0018]通过采用上述技术方案,在用户有预设专利撰写信息获取方式优先级的前提下,能够根据用户所预设的优先级高的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式,而且考虑到用户在没有设置专利撰写信息获取方式优先级的情况,在这个情况下会根据不同专利撰写信息获取方式对审核评估分数的影响情况,来选取最有利于整体审核评估分数的专利撰写信息获取方式来作为本次使用的专利撰写信息获取方式。
[0019]可选的,根据用户历史选用不同专利撰写信息获取方式的审核评估分数的变化情况,分析审核评估分数增长速度最快的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式包括:获取用户历史选用不同专利撰写信息获取方式的审核评估分数;筛选出用户前后两次均选择同一专利撰写信息获取方式的审核评估分数以及间隔时间,分析获取同一专利撰写信息获取方式的审核评估分数增长速度;根据同一专利撰写信息获取方式的审核评估分数增长速度,分析获取同一专利撰写信息获取方式的审核评估分数平均增长速度,并选择其中最高的审核评估分数平均增长速度所对应的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式。
[0020]通过采用上述技术方案,重点考虑前后两次同一专利撰写信息获取方式的审核评估分数的平均增长速度情况,有效避免前后两次不同专利撰写信息获取方式对审核评估分数的影响,而且有利于选取最有利于整体审核评估分数的专利撰写信息获取方式。
[0021]可选的,根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息包括:查询用户预设的专利撰写信息获取方式优先级,其中,专利撰写信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言算法的专利撰写质量核检方法,其特征在于,包括:获取专利撰写信息;根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告,其中,专利撰写信息的审核评估方向包括通顺度审核评估、错别字检测审核评估、去重审核评估;显示审核评估报告。2.根据权利要求1所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,若专利撰写信息的审核评估方向为通顺度审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:用文本增强方法构建多个正负样本;用正负样本训练分类模型,获取段落/句子的通顺度;根据段落/句子的通顺度,形成审核评估报告。3.根据权利要求1所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,若专利撰写信息的审核评估方向为错别字检测审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:用掩码语言模型分析判断每个字的合理性;根据所分析判断每个字的合理性,形成审核评估报告。4.根据权利要求1所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,若专利撰写信息的审核评估方向为单独去重审核评估,根据预设的专利领域语言模型,审核评估专利撰写信息,形成审核评估报告如下:基于simhash功能从历史专利中检索出完全相似的专利;基于语义向量检索出语义上最接近的专利;根据从历史专利中检索出完全相似的专利以及语义向量检索出语义上最接近的专利,分析获取与专利撰写信息的相似度,形成审核评估报告。5.根据权利要求1至4任意一项所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,专利撰写信息的获取包括:获取专利撰写信息的整体审核评估报告;根据预设的专利撰写信息不同审核评估方向的准确率和分值占比,分析获取审核评估分数;若审核评估分数小于预设的第一审核评估分数,则实时获取专利撰写信息;若审核评估分数大于等于预设的第一审核评估分数,则根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息。6.根据权利要求5所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息包括:查询用户预设的专利撰写信息获取方式优先级,其中,专利撰写信息获取方式包括根据预设的第一定期时段定期获取专利撰写信息或根据预设的专利撰写信息所包含的内容量定量获取专利撰写信息;若查询到,则将优先级高的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式;
反之,则根据用户历史选用不同专利撰写信息获取方式的审核评估分数的变化情况,分析审核评估分数增长速度最快的专利撰写信息获取方式,作为本次所使用的专利撰写信息获取方式。7.根据权利要求6所述的一种基于自然语言算法的专利撰写质量核检方法,其特征在于,根据用户历史选用不同专利撰写信息获取方式的审核评估分数的变化情况,分析...

【专利技术属性】
技术研发人员:高涵李佳炜梁彬
申请(专利权)人:维正知识产权科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1