安徽省泰岳祥升软件有限公司专利技术

安徽省泰岳祥升软件有限公司共有35项专利

  • 本申请提供了一种文本有效信息的抽取方法及装置,其中,所述方法包括:确定预设抽取模板信息中的结构化信息;在待抽取文本信息中确定第一抽取信息;确定所述预设抽取模板信息中非结构化信息对应的正则表达式;结合各所述正则表达式,确定所述待抽取文本信...
  • 本申请公开了文本处理模型的训练方法、装置及文本处理方法,所述训练方法应用于多个具有不同任务目标的文本处理模型,多个文本处理模型共享部分隐层。所述方法中,对于每一任务目标,首先将相应训练样本输入至相应文本处理模型中,输出任务目标值;其次根...
  • 本申请实施例提供了一种主观题评价方法及装置,其中,所述方法包括:接收主观题的评分关联数据;计算所述标准答案数据和所述试卷答案数据的语义相似度值;利用所述题干数据对应的基本评分方程和所述语义相似度值,计算所述主观题的基础得分系数;计算所述...
  • 本申请提供了一种诗句生成模型的训练方法、自动写诗方法及装置。该方法在训练诗句生成模型时,诗句的每个节拍均作为主题词,并且对于每个主题词,以其所在诗句之前所有诗句的节拍序列作为输入序列,以主题词所在的诗句作为输出序列,从而使诗句生成模型学...
  • 本申请公开一种基于主动学习的弱监督文本分类方法及装置,首先从未标注的样本集中抽取作为样本簇的簇心的第一样本,基于该第一样本构成初始训练集,并使用初始训练集训练基准模型,得到初始的分类模型,采用第一样本构成初始训练集,不仅降低训练样本数量...
  • 本发明实施例公开一种文本关键信息的提取方法、装置及介质。该提取方法包括:获取待提取文本,所述待提取文本包括标题和正文;生成第一列表,其中,所述第一列表中包括至少一个候选关键单元,所述候选关键单元为利用正文中的组成单元的相似度权重,从正文...
  • 本申请实施例提供了一种内容抽取方法及装置,包括:根据问题树包含的分类表达式获取问题的目标分类;获取目标分类在抽取树中对应的目标抽取节点,并使用目标抽取节点包含的抽取表达式从阅读文本中抽取目标内容;根据目标分类对应的后处理规则,对目标内容...
  • 本申请提供了一种对文本内时间信息归一化的方法及装置,利用每个所述待归一化时间信息,确定所述待归一化时间信息对应的参考时间信息;根据每个所述待归一化时间信息和对应的参考时间信息,将每个所述待归一化时间信息进行归一化处理,得到相应的归一化时...
  • 本发明提供一种指标数据提取方法、装置和计算机设备,该指标数据提取方法包括:获取待提取指标文本,对所述待提取指标文本进行类别项识别,获取所述待提取指标文本中所有类别项;对所述待提取指标文本进行语句结构分析,获取所述所有类别项中指标值相应的...
  • 本申请实施例提供了一种有监督的词向量训练方法及装置,其中,方法包括:根据目标词的上下词,生成目标词的每个语义向量的关注系数;根据语义向量和每个语义向量的关注系数,生成目标词的引导向量;构造从词向量模型的训练结果到引导向量之间的距离损失函...
  • 本申请实施例提供了一种文本抽取模型训练方法、文本抽取方法及装置。其中,该文本抽取模型训练方法将问题语料和答案语料分别拆分成短问题和短答案,并对短答案的核心句进行标注,从而使用短问题和标注的短答案对文本抽取模型进行训练,实现仅使用少量的问...
  • 本申请提供了一种基于公告信息的指代消解方法及装置,该方法包括:对公告信息依序进行命名实体识别,从识别的命名实体中,获取第一个以机构关键词为结尾的机构名称;从所述公告信息中,获取与预设指代条件集相匹配的字符串,将获取的与预设指代条件集相匹...
  • 本申请公开一种阅读理解模型训练数据的过滤方法及装置,首先获取输入文本,将输入文本表示为包含词汇共现信息和位置编码信息的第二词向量;其次根据输入文本的注意力对第二词向量进行加权;对第二词向量的加权结果进行归一化处理生成第一输出矩阵;再对第...
  • 本申请实施例公开一种文本表示方法、装置及介质。该方法包括:确定文本中的目标词;获取所述目标词的词向量,以及所述目标词的每一种语义各自的语义向量;利用所述语义向量确定第一向量,所述第一向量为表示所述目标词在所述文本中的语义的向量;根据所述...
  • 本申请公开了一种文本语义解析方法及装置,其中,方法包括:获取给定文本的向量表示,根据向量表示生成给定文本的编码向量;给定文本包括第一文本和第二文本;编码向量包括第一编码向量和第二编码向量;根据第一编码向量和第二编码向量生成第一注意力和第...
  • 本申请实施例公开一种端到端模型的训练数据增强方法、装置及介质。该方法包括:获取来自训练数据集的目标文本;其中,训练数据集包括多个训练数据,每个训练数据包括对应的输入数据和标注数据,每个输入数据包括至少一个文本;目标文本为任一个训练数据的...
  • 本发明实施例提供了一种文本语义相似度计算方法及装置,本发明实施例利用预定词汇库,从两个文本的词汇并集中选取业务相关的词汇,之后利用得到的业务相关词汇以及两个文本的词汇交集计算得到文本相似度,该技术方案有效提高了文本相似度的计算精度,克服...
  • 本申请提供了一种机器阅读理解模型的分阶段训练方法及装置,具体的,在进行机器阅读理解模型训练时,首先利用极大似然估计函数对目标机器阅读理解模型进行训练,得到基础机器阅读理解模型,然后,再利用最小风险训练损失函数,继续对上述基础机器阅读理解...
  • 本申请提供了一种基于联合损失函数的机器阅读理解模型训练方法及装置,具体的,在进行机器阅读理解模型训练时,利用由极大似然估计函数和最小风险训练函数组成的损失函数,作为机器阅读理解模型的评价指标,以指导机器阅读理解模型参数的调整。由于最小风...
  • 本发明实施例公开一种时间词的抽取方法及装置,方法包括:获取待抽取时间词的文本;在文本中抽取出与第一正则匹配的至少一个第一字符串,第一正则为用于识别日期/时刻/日期时刻的规则;如果在文本中第一字符串之后的第一预设数量个字符中包含预设的第一...