北京金山数字娱乐科技有限公司专利技术

北京金山数字娱乐科技有限公司共有274项专利

  • 本申请提供文本检测模型训练方法及装置、文本检测方法及装置,其中所述文本检测模型训练方法包括:将目标训练图像输入至文本检测模型,其中,目标训练图像标注有对应的标注框;通过所述特征提取层提取所述目标训练图像对应的多个不同尺度的初始特征图;通...
  • 本申请提供一种阅读理解模型的训练方法及装置、阅读理解方法及装置,其中阅读理解模型的训练方法包括:通过阅读理解模型的图构建网络层构建样本文本片段和样本答案的初始第一图网络,以及构建样本问题和样本答案的初始第二图网络;将所述样本文本片段、所...
  • 本申请提供文档处理方法及装置,其中所述文档处理方法包括:接收用户提交的目标问题;基于所述目标问题进行检索,获得所述目标问题对应的至少两篇第一文档;将所述至少两篇第一文档中的第一答案信息进行拼接,生成第二文档;针对所述目标问题对所述第二文...
  • 本申请提供一种嵌套命名实体识别模型的训练方法及装置,其中嵌套命名实体识别模型的训练方法包括:将训练样本语句输入编码器中进行编码,获得训练样本语句对应的第一训练编码向量;并将第一训练编码向量输入解码器包括的至少两个标注分支层进行解码,获得...
  • 本申请提供一种翻译模型,所述翻译模型包括编码器,所述编码器包括2m+1个顺次连接的编码层且前m个编码层与2m+1个编码层中的后m个编码层对应共享编码参数,其中,m为大于1的整数。数。数。
  • 本申请提供文本处理方法及装置,其中所述文本处理方法包括:获取问题文本,并识别所述问题文本中的问题实体;在预设的知识库中链接所述问题实体对应的多个候选实体,以及根据所述问题实体识别所述问题文本的问题类型;基于所述多个候选实体和所述问题类型...
  • 本发明实施例提供了一种成语知识图谱构建方法,该方法包括:获取多个待处理成语及每个待处理成语的描述信息;针对每个待处理成语,对该待处理成语的描述信息进行分析,确定该待处理成语对应的标签;基于所述多个待处理成语及每个待处理成语对应的标签之间...
  • 本发明实施例提供了一种成语知识图谱构建方法,该方法包括:获取多个待处理成语及每个待处理成语的描述信息;针对每个待处理成语,对该待处理成语的描述信息进行分析,确定该待处理成语对应的标签;基于所述多个待处理成语及每个待处理成语对应的标签之间...
  • 本申请提供一种基于任务模型的词语处理方法,包括:获取候选实体片段,并基于候选实体片段生成候选实体片段编码向量;分别对候选实体片段编码向量进行筛选,获得关系抽取编码向量和共指消解编码向量;分别将关系抽取编码向量和共指消解编码向量进行实体识...
  • 本申请提供一种信息提取方法和装置、计算设备及计算机可读存储介质,其中,信息提取方法包括:将问题向量、段落向量集合中的已选段落向量和至少一个未选段落向量输入提取网络,得到每个未选段落向量的匹配分数;将匹配分数最高的未选段落向量与已选段落向...
  • 本说明书提供文本分类模型的训练方法及装置、文本分类方法及装置,其中方法包括:根据样本文本集的第一样本文本和标签集确定第一向量组和第二向量组集合;将第一向量组和第二向量组集合输入词级注意力层,得到第三向量集合和第四向量集合,其中,第三向量...
  • 本申请提供一种答案检测方法及装置,其中所述答案检测方法包括:将待检测文本和待查询问题作为输入集输入向量编码模型,获得所述输入集的编码向量,将所述编码向量输入分类模块进行答案类别划分,以基于所述待检测文本生成所述待查询问题的答案类别的划分...
  • 本申请提供了多音字处理方法及装置、模型训练方法及装置,其中,所述多音字处理方法包括接收包含多音字的中文语句,并确定所述多音字在所述中文语句中的第一位置特征;对所述中文语句进行分词,并基于分词获得的词语以及所述词语的词性确定所述多音字的词...
  • 本申请提供一种翻译模型的训练方法及装置,所述翻译模型包括编码器和解码器,所述编码器包括n个顺次连接的编码层,所述解码器包括n个顺次连接的解码层,第i个编码层的自注意力子层与第i个解码层的自注意力子层共享自注意力参数,其中,n≥1,1≤i...
  • 本申请提供一种翻译模型的训练方法及装置,所述翻译模型包括编码器和解码器,所述编码器包括2m+1个顺次连接的编码层且前m个编码层与后m个编码层对应共享编码参数,和/或,所述解码器包括2n+1个顺次连接的解码层且前n个解码层与后n个解码层对...
  • 本申请提供一种信息提取方法和装置、计算设备及计算机可读存储介质,其中,信息提取方法包括:将问题向量、段落向量集合中的已选段落向量和至少一个未选段落向量输入提取网络,得到每个未选段落向量的匹配分数;将匹配分数最高的未选段落向量与已选段落向...
  • 本申请提供一种基于多任务模型的词语处理方法及装置。其中所述方法包括:获取候选实体片段,并基于候选实体片段生成候选实体片段编码向量;分别对候选实体片段编码向量进行修剪处理,获得关系抽取编码向量和共指消解编码向量;将关系抽取编码向量和共指消...
  • 本申请提供一种语句选词方法及装置,其中所述语句选词方法包括:获取待选词语句和所述待选词语句对应的至少两个候选词,并获取每个候选词的释义语句和用法语句集合;根据所述待选词语句获取待选词语句向量,根据每个候选词的释义语句和用法语句集合获取每...
  • 本申请提一种基于图片的文本生成方法及装置,其中,所述方法包括:确定至少一个目标垂直领域,根据待编辑图片对应所属的目标垂直领域获取所述待编辑图片对应的图片内容信息和所述待编辑图片对应的图片分类信息;根据所述待编辑图片对应的图片内容信息和所...
  • 本申请提供一种手动取词的方法及装置,用于取词模型,所述方法包括:获取目标图像,并对所述目标图像进行手部图像检测;在检测到所述目标图像包含手部图像的情况下,对所述手部图像进行指尖识别,确定指尖位置;确定所述指尖位置对应的候选区域,对所述指...