北京金山数字娱乐科技有限公司专利技术

北京金山数字娱乐科技有限公司共有274项专利

  • 本申请实施例提供的一种多标签分类模型训练方法、装置及电子设备,应用于模型训练的技术领域,包括:获取目标语料库及预先标注的多个单标签语料;针对任一单标签语料,计算该单标签语料与目标语料库中各语料的相似度,并选取目标语料库中对应相似度大于预...
  • 本申请提供数据存储方法及装置,其中所述数据存储方法包括:获取当前热点数据和用户历史查询数据;根据所述当前热点数据和所述用户历史查询数据,确定至少一个目标热点信息;提取各目标热点信息的目标特征,按照一一对应存储的方式,将各目标热点信息和各...
  • 本申请提供一种手势识别方法及装置,其中所述手势识别方法包括:通过图像采集设备采集手势图像数据;对所述手势图像数据中像素点的像素值进行并行归一化处理,获得图像归一化向量;将所述图像归一化向量输入预先量化的手势识别模型,获得手势识别结果,提...
  • 本申请提供语句处理方法及装置,其中所述语句处理方法包括:获取包含错别字的待纠错语句;确定所述错别字对应的候选字,并基于所述候选字和所述待纠错语句生成候选语句;构建所述候选语句对应的前向语句特征和后向语句特征;将所述前向语句特征和所述后向...
  • 本申请提供文本处理方法及装置,其中所述文本处理方法包括:获取待处理文本和问题文本,其中,所述问题文本与所述待处理文本相关;在所述待处理文本中提取所述问题文本对应的多个候选答案;将所述多个候选答案和所述问题文本输入至语义匹配模型进行处理,...
  • 本申请提供一种简历文档匹配方法、装置、计算设备及存储介质,其中所述简历人岗匹配方法包括:获取待匹配的目标简历文档以及预设的职位描述;提取目标简历文档中的文本内容;根据文本内容及职位描述,确定目标简历文档与职位描述的语义相似度;基于语义相...
  • 本申请提供一种简历文档识别方法、装置、计算设备及存储介质,其中所述简历文档识别方法包括:获取待识别的目标文档,从目标文档中提取文档信息;基于文档信息,对目标文档进行简历文档识别处理,得到目标文档是否为简历文档的识别结果,其中,简历文档识...
  • 本申请提供简历文档识别模型训练方法、简历文档识别方法及装置,其中所述简历文档识别模型的训练方法包括:获取样本集,其中,样本集中包括多个样本文档,提取任一样本文档,对该样本文档进行分词,基于分词结果,得到该样本文档的分词特征,基于各样本文...
  • 本申请提供一种简历检索方法及装置,其中所述简历检索方法包括:获取简历检索文本;对所述简历检索文本进行实体识别,识别所述简历检索文本中的各实体内容;针对所述各实体内容,利用预设关联规则,确定出与该实体内容关联的目标检索关键词;基于各目标检...
  • 本申请提供文本数据处理方法及装置,其中所述文本数据处理方法包括:获取对应目标领域的待处理数据以及待处理数据对应的特征标签;基于待处理数据中的特征信息和特征标签构建与目标领域相关联的特征信息数据库;接收携带有待检索问题的检索请求,并基于待...
  • 本申请提供一种文档解析方法、系统及装置,其中所述文档解析方法包括:获取目标文档,并提取所述目标文档包含的至少一个文本信息;对所述至少一个文本信息进行文本分类,获得每个文本信息的文本类别;根据所述文本类别对所述至少一个文本信息进行信息抽取...
  • 本申请提供一种问题文本分析模型的训练方法及装置,其中,所述问题文本分析模型的训练方法包括:获取训练样本和所述训练样本对应的样本标签,所述训练样本包括问题文本,所述样本标签包括所述问题文本对应的意图标签、关系标签和实体标签;将所述问题文本...
  • 本申请提供一种数据处理方法及装置,对于编码器的至少一个编码层,所述方法包括:接收待翻译文本对应的待编码矩阵;根据所述待编码矩阵进行深度分离卷积操作获得第一子层矩阵,根据所述待编码矩阵进行自注意力计算获得第二子层矩阵;将所述第一子层矩阵和...
  • 本说明书实施例提供一种模型训练方法、文本检测方法及装置,该模型训练方法包括:获取训练样本,训练样本包含训练样本图像以及训练样本图像中竖向文本的标签框;对训练样本图像进行处理,使训练样本图像中的竖向文本转换成横向文本;通过文本检测模型提取...
  • 本申请提供一种答案抽取模型的训练方法及装置,其中所述答案抽取模型的训练方法包括:从原始语料中确定样本文本,并在预先构建的问题集中筛选与所述样本文本相关联的至少一个待查询问题以及对应的答案标签;将任意一个所述待查询问题与所述样本文本输入预...
  • 本申请提供一种实体识别方法、模型训练方法及装置,其中,实体识别方法包括:获取待识别文本及预先训练的实体识别模型,将待识别文本分别输入实体识别模型的第一子模型和第二子模型,得到第一词特征向量和第二词特征向量,然后将第一词特征向量和第二词特...
  • 本申请提供候选实体生成模型训练方法及装置,其中所述候选实体生成模型训练方法包括:接收训练样本,训练样本包括实体样本和实体描述文本样本;将实体样本和实体描述文本样本分别输入至特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;将实...
  • 本申请提供一种问题检索模型的训练方法及装置、问题检索方法及装置,其中所述问题检索模型的训练方法包括:获取样本问题答案对,并将样本问题答案对存储至预设检索数据库;根据获得的第一样本问题,从预设检索数据库中获取关联的第一参考样本问题;根据第...
  • 本申请提供关键词组合生成模型训练方法及装置,其中所述关键词组合生成模型训练方法包括:获取样本问题和所述样本问题对应的样本答案;提取所述样本问题的至少一个初始关键词组合,确定每个初始关键词组合对应的关联文档集合;根据所述样本答案和每个关联...
  • 本申请提供基于知识图谱的检索方法及装置,其中所述基于知识图谱的检索方法包括:获取检索语句,根据所述检索语句,在知识图谱中确定最小子图,并计算最小子图中各节点的中间中心度和图嵌入表示;根据预先设置的中心度阈值,确定最小子图中的至少两个目标...