北京金山数字娱乐科技有限公司专利技术

北京金山数字娱乐科技有限公司共有274项专利

  • 本申请提供样本处理方法及装置,其中所述样本处理方法包括:获取样本语料,并构建所述样本语料对应的初始文本意群;为所述样本语料添加语境标签,以及提取所述初始文本意群对应的初始词组;建立所述语境标签和所述初始文本意群的对应关系;根据所述对应关...
  • 本申请提供一种基于知识图谱的信息纠错方法及装置,其中所述方法包括:获取包含第一类提及词和第二类提及词的待检测三元组;根据预设的知识图谱对所述待检测三元组进行校验,在所述待检测三元组未通过校验的情况下,根据所述第一类提及词在所述知识图谱中...
  • 本申请提供一种知识图谱的数据监控方法及装置,其中所述方法包括:根据目标知识图谱所属的目标知识领域,构建所述目标知识领域对应的知识规则;根据所述目标知识领域对应的知识规则,构建至少一个符合所述目标知识领域对应的知识规则的信息检测条件;从目...
  • 本申请提供识别模型的训练方法及装置、文本识别方法及装置,其中所述识别模型的训练方法包括:获取训练文本;将所述训练文本输入待训练识别模型,经过所述待训练识别模型中的语言模块对所述训练文本进行编码处理,获得特征向量;将所述特征向量分别输入所...
  • 本申请提供一种问答模型的训练方法及装置、问答方法及装置,其中问答模型的训练方法包括:获取样本问题、至少两个样本文本和样本标签;将样本问题和至少两个样本文本输入问答模型的阅读理解模块,得到至少两个预测答案、每个预测答案的上下文文本和每个样...
  • 本申请提供信息抽取方法及装置,其中信息抽取方法包括:获取待处理文档;识别待处理文档中的文本和表格;基于关键词识别算法对文本进行关键信息识别,确定文档文本关键信息;对表格中单元格的字符进行解析,得到文档表格关键信息;将文档文本关键信息和文...
  • 本申请提供文字识别模型的训练方法及装置,其中所述文字识别模型的训练方法包括:获取样本数据,并确定所述样本数据中的形近字;在预设的字典中提取所述形近字对应的替换形近字,并基于所述替换形近字对所述样本数据进行更新,获得负样本数据;基于所述负...
  • 本申请提供一种基于模型融合的文章分类方法及装置,其中所述基于模型融合的文章分类方法包括:获取待分类文章,其中,所述待分类文章包括文本信息和图片信息;将所述文本信息输入至预先训练好的文本分类模型获得所述文本分类模型输出的文本分类信息,将所...
  • 本申请提供一种基于本体的数据校验方法及装置,其中所述基于本体的数据校验方法包括:获取待校验数据;在预设的本体中确定与所述待校验数据对应的至少一个校验规则;根据每个所述校验规则对所述待校验数据进行校验,获取每个所述校验规则对应的校验子结果...
  • 本申请提供一种会议纪要生成方法及装置,其中所述会议纪要生成方法包括:对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;接收针对所述会议文本的会议属性信息;将所述会议属性信息和所述会议文本输入至会议纪要生成模型;通过...
  • 本申请提供问答模型的训练方法及装置,其中所述问答模型的训练方法包括:获取训练样本,并提取所述训练样本中的目标词单元;根据所述目标词单元构建所述训练样本对应的样本词组;基于所述样本词组查询预先生成的场景定向词表空间,根据查询结果确定所述训...
  • 本申请提供文本处理方法及装置,其中所述文本处理方法包括:获取问题文本以及包含所述问题文本对应的候选答案的目标文本;在所述目标文本中提取包含所述候选答案的候选语句;根据所述目标文本、所述候选语句以及所述问题文本构建候选答案特征,并基于所述...
  • 本申请提供一种基于多任务模型的词语处理方法及装置,所述方法包括:获取候选实体片段,并基于候选实体片段生成候选实体片段编码向量;通过实体识别模型对候选实体片段编码向量进行实体识别处理和分类剪枝处理,获得识别剪枝编码向量;将识别剪枝编码向量...
  • 本申请提供图像识别模型的训练方法及装置、图像识别方法及装置,其中所述图像识别模型包括编码器和解码器,所述图像识别模型的训练方法包括:获取训练数据,其中,所述训练数据包括样本图像和所述样本图像对应的样本描述信息;将所述样本图像输入至所述编...
  • 本申请提供一种三线表格图像识别方法及装置,其中所述三线表格图像识别方法包括:获取待识别图像,其中,所述待识别图像包括三线表格;确定所述三线表格的关键点信息,并根据所述关键点信息确定所述三线表格的顶线、底线和栏目线;根据所述顶线、所述底线...
  • 本申请提供一种目标检测模型的训练方法及装置,其中所述目标检测模型的训练方法包括:获取第一训练图像;将所述第一训练图像输入至候选区域检测模型,获得所述第一训练图像对应的第一候选区域信息;将所述第一训练图像和所述第一候选区域信息输入至待训练...
  • 本申请提供一种阅读理解模型的训练方法及装置、阅读理解方法及装置,其中阅读理解模型的训练方法包括:通过阅读理解模型的图构建网络层构建样本文本片段和样本答案的初始第一图网络,以及构建样本问题和样本答案的初始第二图网络;将所述样本文本片段、所...
  • 本申请提供一种预测答案的确定方法及装置、阅读理解方法及装置,其中预测答案的确定方法包括:通过序列标注函数将目标隐层特征向量每一维的值转换成至少一个预测概率,该目标隐层特征向量每一维对应一个词单元,每一维对应的至少一个预测概率表征每一维对...
  • 本申请提供一种图网络的构建方法及装置、阅读理解方法及装置,图网络的构建方法包括:将第一特征向量组中的第一特征向量确定为初始第一图网络中第一节点的注意力值,第一节点为初始第一图网络中样本文本片段的词单元对应的节点;将第三特征向量组中的第三...
  • 本申请提供文本识别方法及装置,其中所述文本识别方法包括:获取待识别文本;将所述待识别文本输入至识别模块进行处理,获得所述待识别文本中目标字符,以及所述目标字符对应的文本框;建立所述目标字符与所述文本框的位置关系,并根据所述位置关系生成所...