【技术实现步骤摘要】
一种术语生成方法、装置及存储介质
本申请涉及计算机领域,尤其涉及一种术语生成方法、装置及存储介质。
技术介绍
有许多业务领域会有专业的团队构建出一些规范化的术语,以便本领域的人员能够统一认识,方便技术的学习和推广。例如:生物、化学领域的基因本体论通过创建可具代表性的规范化的基因和基因产物特性的术语描绘或词义解释的工作平台,方便生物化学领域的人员进行技术的学习和推广。但是,一般的术语大多由专家手工定义、组织,效率低并且耗费人力,并且不同的专家可能使用不同的表达方式来描述同一个概念,可能会导致术语命名不一致的问题。
技术实现思路
本说明书实施例的目的在于提供一种术语生成方法、装置及存储介质,实现了一种能够根据待处理文本自动进行术语自动生成的方法,提高了术语的准确性,带动了生物领域的推广应用。一方面、本专利技术提供一种术语生成方法,所述方法包括:接收待处理文本;获取所述待处理文本的单词信息、基因信息;根据所述待处理文本的单词信息、基因信息,利用预先构建好的术语生成模型,生成所述待处理文本 ...
【技术保护点】
1.一种术语生成方法,其特征在于,所述方法包括:/n接收待处理文本;/n获取所述待处理文本的单词信息、基因信息;/n根据所述待处理文本的单词信息、基因信息,利用预先构建好的术语生成模型,生成所述待处理文本对应的目标术语;其中,所述术语生成模型基于术语、基因信息、单词信息之间的关联关系训练获得。/n
【技术特征摘要】
1.一种术语生成方法,其特征在于,所述方法包括:
接收待处理文本;
获取所述待处理文本的单词信息、基因信息;
根据所述待处理文本的单词信息、基因信息,利用预先构建好的术语生成模型,生成所述待处理文本对应的目标术语;其中,所述术语生成模型基于术语、基因信息、单词信息之间的关联关系训练获得。
2.根据权利要求1所述的方法,其特征在于,所述术语生成模型包括术语编码子模型和术语解码子模型,所述术语编码子模型用于根据所述待处理文本的单词信息、基因信息生成所述待处理文本的术语编码信息,所述术语解码子模型用于对所述术语编码信息进行解码获得所述待处理文本对应的目标术语。
3.根据权利要求2所述的方法,其特征在于,所述术语生成模型采用下述方法构建:
采集样本数据集,所述样本数据集中包括多个样本文本以及各个样本文本对应的术语名称、基因信息、摘要信息;
根据所述样本数据集中各个样本文本的术语名称、基因信息、摘要信息构建出术语异构图;
利用卷积神经网络算法对所述术语异构图进行学习,构建出所述术语编码子模型;
根据所述术语编码子模型对所述样本数据集中各个样本文本的术语编码信息和所述样本数据集中各个样本文本的术语名称,训练构建所述术语解码子模型。
4.根据权利要求2所述的方法,其特征在于,所述术语解码子模型采用拷贝机制对所述术语编码信息进行解码获得所述待处理文本对应的目标术语。
5.根据权利要求3所述的方法,其特征在于,所述根据所述样本数据集中各个样本文本的术语名称、基因信息、摘要信息构建出术语异构图,包括:
所述术语异构图中的节点为所述样本数据集中各个样本文本的术语名称、基因信息或摘要信息,所述术语异构图中的边为单词规范化值或基因术语值,其中,所述单词规范化值表征所述样本文本中单词的规范化数值,所述基因术语值用于表征所述样本文本中的基因与术语之间的相似度。
6.一种术语生成模型构建方法,其特征在于,包括:
构建样本数据集,所述样本数据集中包括多个样本文本以及各个样本文本...
【专利技术属性】
技术研发人员:张小波,
申请(专利权)人:安徽正诺智能科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。