北京金山数字娱乐科技有限公司专利技术

北京金山数字娱乐科技有限公司共有274项专利

  • 本申请提供的所述多音字处理方法及装置,其中,所述方法包括基于语言模型以及多音字消歧模型的双向长短期记忆网络,获得包含多音字的中文语句的语义上下文向量;对所述中文语句进行分词,并基于分词获得的词语以及所述词语的词性确定所述中文语句中多音字...
  • 本申请提供一种数据处理、目标识别模型训练、目标识别方法及装置,其中,数据处理方法包括:基于获取的训练集,训练出多个不同的目标识别模型,然后利用训练得到的各目标识别模型,分别对训练集中的各训练文本进行目标识别,得到各训练文本的目标识别结果...
  • 本申请提供一种基于知识图谱的候选人确定方法及装置,其中所述基于知识图谱的候选人确定方法包括:构建职位技能知识图谱和候选人技能知识图谱;获取招聘需求信息,并基于所述招聘需求信息生成招聘技能子图;根据所述招聘技能子图和所述职位技能知识图谱,...
  • 本申请提供一种基于知识图谱的筛选方法及装置,其中,所述基于知识图谱的筛选方法包括:获取目标对象信息;将所述目标对象信息添加至由候选对象集合构建的知识图谱中,确定目标对象信息对应的目标社区,其中,所述知识图谱中包括多个社区;根据所述目标社...
  • 本申请提供一种图数据库更新方法及装置,其中所述图数据库更新方法包括:响应于用户的图数据库更新请求,构建新图数据库对应的新本体结构;将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;...
  • 本申请提供一种信息提取方法及装置,其中所述信息提取方法包括:获取待处理图片,并通过版面检测模型获取所述待处理图片中各版面元素的类型以及各版面元素的区域信息,其中所述区域信息包括位置信息和尺寸信息;通过文本检测模型获取所述待处理图片中的文...
  • 本申请提供一种文本处理方法及装置,其中所述文本处理方法包括:基于获取的待答复问题,确定待答复问题的语义向量、多个候选文本和多个候选文本的语义向量,其中,每个候选文本是文本库中与待答复问题语义相关的文本;基于待答复问题和多个候选文本的关联...
  • 本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质,涉及计算机技术领域,包括:获得第一语料对,第一语料对包括:源语言的第一源文本,以及所述第一源文本对应的、目标语言的第一目标文本;利用所述第一语料对训练样本构建模型,样本构建模...
  • 本发明实施例提供了内容关联方法、系统、装置、电子设备及存储介质。该方法可以包括:检测用户的目标文档中是否存在符合第一格式条件的第一文本;第一格式条件为以第一标注符号的符号内容作为起始内容和终止内容,且在起始内容和终止内容之间具有文本内容...
  • 本发明实施例提供了内容关联方法、系统、装置、电子设备及存储介质。该方法包括:获取目标文档中的标题,作为待处理内容;确定各个指定文档中关于所述待处理内容的关联词;其中,所述指定文档为包含有所述待处理内容的文档,所述关联词为与所述待处理内容...
  • 本申请提供的所述目标文本确定方法及装置,其中,所述方法包括获取目标问题,并将所述目标问题输入搜索数据库获取所述目标问题对应的至少一个初始文本;将所述目标问题和所述至少一个初始文本输入分类模型,获得所述至少一个初始文本包含所述目标问题对应...
  • 本申请提供问答模型的训练方法及装置,其中所述问答模型的训练方法包括:构建样本语料对应的初始文本意群,并基于所述初始文本意群生成所述样本语料对应的场景定向词表空间;获取训练样本,并确定所述训练样本对应的样本词组;基于所述样本词组查询所述场...
  • 本申请提供一种文本识别模型的训练方法及装置、文本识别方法及装置,其中所述文本识别模型的训练方法包括:将获取的第一样本图像输入文本识别模型的区域检测网络,确定第一样本图像的至少一个第一子样本图像;将至少一个第一子样本图像输入文本识别模型的...
  • 本申请提供一种知识图谱构建方法及装置,其中所述方法包括:创建图谱编辑器对应的交互控件,通过所述交互控件接收图谱编辑信息;通过所述图谱编辑器将所述图谱编辑信息转化为与当前数据库架构对应的结构化数据;基于所述结构化数据生成所述图谱编辑信息对...
  • 本申请提供文本处理方法及装置,其中所述文本处理方法包括:获取问题文本以及包含所述问题文本对应的候选答案的目标文本;在所述目标文本中提取包含所述候选答案的候选语句;根据所述目标文本、所述候选语句以及所述问题文本构建候选答案特征,并基于所述...
  • 本申请提供一种语言表征模型的训练方法及装置,所述语言表征模型包括至少两个顺次连接的堆栈层,每个所述堆栈层包括至少一个注意力头,所述语言表征模型的训练方法包括:获取目标文本语句中每个字符对应的原始向量和目标向量,将所述每个字符对应的原始向...
  • 本申请提供一种翻译模型,所述翻译模型包括解码器,所述解码器包括2n+1个顺次连接的解码层且前n个解码层与2n+1个解码层中的后n个解码层对应共享解码参数,其中,n为大于1的整数。
  • 本申请提供一种翻译模型,所述翻译模型包括编码器和解码器,所述编码器包括2m+1个顺次连接的编码层且前m个编码层与2m+1个编码层中的后m个编码层对应共享编码参数,所述解码器包括2n+1个顺次连接的解码层且前n个解码层与2n+1个解码层中...
  • 本申请提供一种基于知识库问答的实体抽取方法及装置,其中所述方法包括:获取目标问题语句并对所述目标问题语句进行实体识别,分别确定所述目标问题语句中的至少一个第一预测实体和至少一个第二预测实体;根据所述至少一个第一预测实体和至少一个第二预测...
  • 本申请提供命名实体识别模型训练方法及装置,其中所述命名实体识别模型训练方法包括:获取有标注训练数据和无标注训练数据;根据所述有标注训练数据训练目标命名实体识别模型;将所述无标注训练数据输入至所述目标命名实体识别模型,获得所述目标命名实体...