知呱呱天津大数据技术有限公司专利技术

知呱呱天津大数据技术有限公司共有22项专利

  • 本申请公开了一种智能辅助审查方法及系统,方法包括模型设计、数据集构建、模型训练以及执行预测四个步骤,具体包括构建一个包含压缩阶段和分类阶段的两阶段模型;定义触发规则的分类标签,以及确定分类标签的正负例数据;设置数据集的训练次数,并根据损...
  • 本发明公开了一种基于图文多模态双曲嵌入的专利IPC分类方法及系统,该方法包括专利图文多模态双曲嵌入的处理及IPC多标签分类的处理:专利图文多模态双曲模型训练数据集构建,利图文多模态双曲模型训练,应用所述专利图文多模态双曲模型对待加工专利...
  • 本发明公开了一种基于IPC标签共现的规则检核方法及系统,采用的IPC标签频繁模式,通过IPC规则检核算法得到满足设定置信度阈值的预测结果,提升了IPC多标签分类结果的置信度。本发明采用了IPC标签上下文模型,利用了共享同一篇专利的多个I...
  • 本申请公开了一种基于扩散模型的科技文献附图生成方法及系统,方法包括通过获取目标文献中的图片文本描述以及对应图片,并形成训练数据对;然后利用训练数据,对扩散模型进行训练;最后将训练数据当中的图片描述性文本当中的各个组件以及各组件直接的联系...
  • 本申请公开了一种用于专利的生成式检索方法及系统,方法结合专利文本特点以及专利的IPC多级分类体系进行统一融合编码,并设计综合损失函数优化训练模型至收敛,通过训练好的生成式专利编码模型对专利库中的所有文档进行专利编码,在专利检索阶段利用训...
  • 本申请公开了一种多轮对话上下文向量增强方法及系统,方法包括通过Ernie3模型编码,智能化地从对话内容中提取出语义信息并形成初始上下文向量;接收预处理过的文本作为输入并通过各个下游任务进行学习,从而提取出不同的任务特性并形成增强向量;利...
  • 本申请公开了一种基于多模态融合的专利附图多语言图解生成方法及系统,方法包括以世界专利数据为数据基础,设计基于深度学习模型的多模态模型架构,包括图像编码器,文本编码器以及解码器
  • 本申请公开了一种在大语言模型生成文本中嵌入及检测数字水印的方法
  • 本申请公开了一种基于特征对齐的专利多领域知识抽取方法及系统,方法包括模型训练以及模型应用两个部分,其中模型训练部分具体包括领域及任务配置
  • 本申请提供了一种基于大语言模型和图算法的专利查询报告生成方法
  • 本发明公开了一种机器生成文本的检测方法及系统,通过近义词替换对目标样本实施扰动,计算生成概率差值以实现扰动差异检测;根据目标生成模型对样本的预测概率、预测概率排名以及预测分布交叉熵进行计算,并基于这三个统计指标实现统计检测;综合考虑上述...
  • 本申请公开了一种模型生成文本的评估方法及计算机设备,不依赖于标签,适用于生产环境。该评估方法分别通过基因、可读性和指纹三个指标分别评估后,再进行综合评估;其中,基因指标用于衡量模型生成文本与输入文本的语义相关性和同源情况,可读性指标用于...
  • 本发明公开了一种基于对比学习算法的多模态商标检索方法及系统,该方法包括:分别对商标文本、商标图像进行清洗和规范化处理,得到结构化文本;训练进行商标图像编码的模型,将已处理的商标图像进行编码,生成多维向量;建立索引结构,向量空间分解并分别...
  • 本申请公开了一种面向模型生成文本重复退化现象的优化生成方法,其中采用了注意转换(朝向反射)机制及其与注意力机制组合形成的注意机制,并引入遗传算法,丰富输入文本多样性,与神经网络注意机制结合,兼顾了模型的理解能力和生成能力,弱化了生成文本...
  • 本申请公开了一种基于层级BERT模型与标签迁移的长文本摘要生成方法,能够根据文本自有标签有倾向性的提取出与主题相关度强的文本内容、并生成流畅通顺的摘要文本。该方法首先使用分块算法对待摘要的长文本进行文本块的划分;使用经过训练的BERT模...
  • 本发明公开了一种用于专利文件处理的预训练模型的构建方法,其特征在于,包括模型构建、数据预处理、训练语料生成、辅助训练任务、下游微调任务、模型保存输出的步骤。技术方案通过对文档内部的标题、摘要、权利要求、说明书等各组成部分语义结构关系编码...
  • 本发明实施例提供了一种长文本摘要生成方法、系统、设备及存储介质,基于预设领域采集预设数量的长文本数据,针对每个长文本数据经文本切割、抽取、排序得到关键词/短语序列,利用关键词/短语序列作为约束条件,得到四元组训练数据以构建训练集,对编码...
  • 本发明公开了一种基于多任务特征协同的生成专利摘要的方法及系统,基于多任务模型分别生成要解决的技术问题和有益效果、用途、核心方案、发明点、其他技术方案中的发明信息等生成文本,通过汇总生成专利摘要流程得到最终的专利摘要,实现输入原始专利文本...
  • 本申请公开了一种专利用途改写的数据深加工方法及计算机设备,旨在解决现有技术无法支持针对专利用途方面的专项检索、分析的问题。该方法通过对样本库专利文献对应的人工撰写的用途目标文本,基于词频对数线性规律以及覆盖文献数排序、结合停用词技巧构造...
  • 本申请公开了一种基于图注意力机制的专利多层级分类方法及计算机设备。该方法首先通过专利文本片段分割以及标签定义提取,生成专利文本树形结构和标签定义树形结构;然后通过节点文本相似度计算,查找相似向量,在对应节点之间添加边;再利用注意力机制得...