目标信息显示方法、装置、电子设备和介质制造方法及图纸

技术编号:28295630 阅读:12 留言:0更新日期:2021-04-30 16:19
本公开提供了一种目标信息显示方法、装置、电子设备和计算机可读存储介质,涉及信息处理领域。其中,目标信息显示方法包括:基于注意力机制的权重模型的第一层模型,确定词向量表示的第一权重;基于词向量表示的第一权重,将多个词向量表示处理为对应的语句向量表示;基于权重模型的第二层模型,确定语句向量表示的第二权重;将第二权重大于第一阈值的语句向量表示对应的原始文本中的语句文本配置为目标语句序列;将第一权重大于第二阈值的词向量表示对应的目标语句序列中的词文本配置为目标词序列;对目标语句序列和/或目标词序列进行突出显示。通过本公开的技术方案,能够提高关键信息提取的准确性,以提升辅助用户阅读的效果。

【技术实现步骤摘要】
目标信息显示方法、装置、电子设备和介质
本公开涉及信息处理领域,尤其涉及一种目标信息显示方法、装置、电子设备和计算机可读存储介质。
技术介绍
关键词句的高亮显示,是指为了让读者通过阅读文章部分文字,了解全篇的关键信息。将这些起到关键作用的文字高亮显示,引导读者将注意力放到高亮的文字上,从而更快的获取想要的关键信息。相关技术中,在已知关键词的前提下,通过全文搜索关键词,对关键词进行定位,并将关键词前后的内容确定为整片文章的主要内容,并进行高亮,但存在以下缺陷:由于通常通过阅读大量文章才能确定关键词,因此具体的关键词内容和关键词数量较难确定,导致得到的关键信息的准确率低,效果差。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种目标信息显示方法、装置、电子设备和计算机可读存储介质,至少在一定程度上克服相关技术中关键信息提取的准确率低,效果差的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种目标信息显示方法,包括:将原始文本处理为多个词向量表示;基于注意力机制的权重模型的第一层模型,确定所述词向量表示的第一权重;基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示;基于所述权重模型的第二层模型,确定所述语句向量表示的第二权重;将所述第二权重大于第一阈值的所述语句向量表示对应的所述原始文本中的语句文本配置为目标语句序列;将所述第一权重大于第二阈值的所述词向量表示对应的所述目标语句序列中的词文本配置为目标词序列;在所述原始文本中,对所述目标语句序列和/或所述目标词序列进行突出显示。在一个实施例中,所述将原始文本处理为多个词向量表示包括:基于分割符号对所述原始文本进行切分,生成多个句序列;对所述句序列进行分词处理,生成多个词序列;将所述词序列转化为所述词向量表示;以及对所述句序列和所述词序列在所述原始文本中的位置进行标注,生成位置标注信息。在一个实施例中,所述将所述词序列转化为所述词向量表示包括:基于独热编码将所述词序列转换为所述词向量表示。在一个实施例中,所述基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示包括:将每个所述词向量表示与对应的所述第一权重相乘,得到第一乘积向量;对多个所述第一乘积向量进行求和,得到所述语句向量表示。在一个实施例中,还包括:基于所述权重模型的第二层模型输出所述原始文本的分类标签。在一个实施例中,所述基于所述权重模型的第二层模型输出所述原始文本的分类标签包括:将每个所述语句向量表示与对应的所述第二权重相乘,得到第二乘积向量;对多个所述第二乘积向量进行求和,得到文本向量表示;基于所述文本向量表示对所述原始文本进行分类,以根据分类结果得到所述分类标签。在一个实施例中,所述基于所述第二权重提取所述原始文本中的目标语句序列,以及基于所述第一权重提取所述目标语句序列中的目标词序列包括:将所述第二权重大于第一阈值的所述语句向量表示确定为目标语句向量;基于所述目标语句向量提取所述原始文本中的所述目标语句序列;将所述第一权重大于第二阈值的所述词向量表示确定为目标词向量;基于所述目标词向量提取所述目标语句序列中的所述目标词序列。在一个实施例中,所述在所述原始文本中,对所述目标语句序列和/或所述目标词序列进行突出显示包括:对所述目标语句序列和所述目标词序列进行突出显示,包括:从所述位置标注信息中提取所述目标语句序列的第一位置标注信息,以及所述目标词序列的第二位置标注信息,基于所述第一位置标注信息与所述第二位置标注信息确定所述原始文本中的突出显示位置,以基于所述突出显示位置进行突出显示。在一个实施例中,在将原始文本处理为多个词向量表示之前,还包括:将已打标签的训练文本输入分层注意力机制的神经网络模型;基于所述神经网络模型输出的预测标签与所述已打标签之间的误差,对所述神经网络模型的参数进行迭代训练,直至所述误差减小至小于或等于误差阈值,其中,所述神经网络的参数包括所述第一权重与所述第二权重。在一个实施例中,所述训练文本被处理为训练词向量,所述基于所述神经网络模型输出的预测标签与所述已打标签之间的误差,对所述神经网络模型的参数进行迭代训练包括:对每个所述训练词向量的权重进行第一初始赋值基于所述第一初始赋值,将所述多个训练词向量处理为对应的训练语句向量;对每个所述训练语句向量的权重进行第二初始赋值;基于所述第二初始赋值,将所述多个训练语句向量处理为对应的训练文本向量;对所述训练文本向量进行分类预测,以输出所述预测标签;基于预测标签与所述已打标签之间的误差,对所述词向量的权重与所述训练语句向量的权重进行迭代更新,直至所述误差减小至小于或等于所述误差阈值,以基于所述迭代更新的结果得到所述第一权重与所述第二权重。根据本公开的另一个方面,提供一种目标信息显示装置,包括:第一处理模块,用于将原始文本处理为多个词向量表示;第一确定模块,用于基于注意力机制的权重模型的第一层模型,确定所述词向量表示的第一权重;第二处理模块,用于基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示;第二确定模块,用于基于所述权重模型的第二层模型,确定所述语句向量表示的第二权重;提取模块,用于基于所述第二权重提取所述原始文本中的目标语句序列,以及基于所述第一权重提取所述目标语句序列中的目标词序列;显示模块,用于在所述原始文本中,对所述目标语句序列和/或所述目标词序列进行突出显示。根据本公开的再一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的目标信息显示方法。根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的目标信息显示方法。本公开的实施例所提供的目标信息显示方案,当接收到没有标签的原始文本时,通过学到的权重模型,得到原始文本中的语句的第二权重,以及词语的第一权重,并基于第二权重与第一阈值的关系,确定目标语句序列,以及目标语句序列中第一权重与第二阈值的关系,确定目标语句中包括的目标词,基于目标语句和/或目标词,得到关键词句,关键词句即文本中权重较高的句子,及权重高的句子中,权重较高的单词,通过对目标语句序列和/或所述目标词序进行突出显示,得到重新显示的文本,从而能够提高关键信息提取的准确性,以提升辅助用户阅读的效果,进而提升突出显示对用户的使用体验。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一本文档来自技高网...

【技术保护点】
1.一种目标信息显示方法,其特征在于,包括:/n将原始文本处理为多个词向量表示;/n基于注意力机制的权重模型的第一层模型,确定所述词向量表示的第一权重;/n基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示;/n基于所述权重模型的第二层模型,确定所述语句向量表示的第二权重;/n基于所述第二权重提取所述原始文本中的目标语句序列,以及基于所述第一权重提取所述目标语句序列中的目标词序列;/n在所述原始文本中,对所述目标语句序列和/或所述目标词序列进行突出显示。/n

【技术特征摘要】
1.一种目标信息显示方法,其特征在于,包括:
将原始文本处理为多个词向量表示;
基于注意力机制的权重模型的第一层模型,确定所述词向量表示的第一权重;
基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示;
基于所述权重模型的第二层模型,确定所述语句向量表示的第二权重;
基于所述第二权重提取所述原始文本中的目标语句序列,以及基于所述第一权重提取所述目标语句序列中的目标词序列;
在所述原始文本中,对所述目标语句序列和/或所述目标词序列进行突出显示。


2.根据权利要求1所述的目标信息显示方法,其特征在于,所述将原始文本处理为多个词向量表示包括:
基于分割符号对所述原始文本进行切分,生成多个句序列;
对所述句序列进行分词处理,生成多个词序列;
将所述词序列转化为所述词向量表示;以及
对所述句序列和所述词序列在所述原始文本中的位置进行标注,生成位置标注信息。


3.根据权利要求2所述的目标信息显示方法,其特征在于,所述将所述词序列转化为所述词向量表示包括:
基于独热编码将所述词序列转换为稀疏向量;
基于词嵌入的处理方式将所述稀疏向量转化为所述词向量表示。


4.根据权利要求1所述的目标信息显示方法,其特征在于,所述基于所述词向量表示的第一权重,将所述多个词向量表示处理为对应的语句向量表示包括:
将每个所述词向量表示与对应的所述第一权重相乘,得到第一乘积向量;
对多个所述第一乘积向量进行求和,得到所述语句向量表示。


5.根据权利要求1所述的目标信息显示方法,其特征在于,还包括:
基于所述权重模型的第二层模型输出所述原始文本的分类标签。


6.根据权利要求5所述的目标信息显示方法,其特征在于,所述基于所述权重模型的第二层模型输出所述原始文本的分类标签包括:
将每个所述语句向量表示与对应的所述第二权重相乘,得到第二乘积向量;
对多个所述第二乘积向量进行求和,得到文本向量表示;
基于所述文本向量表示对所述原始文本进行分类,以根据分类结果得到所述分类标签。


7.根据权利要求1所述的目标信息显示方法,其特征在于,所述基于所述第二权重提取所述原始文本中的目标语句序列,以及基于所述第一权重提取所述目标语句序列中的目标词序列包括:
将所述第二权重大于第一阈值的所述语句向量表示确定为目标语句向量;
基于所述目标语句向量提取所述原始文本中的所述目标语句序列;
将所述第一权重大于第二阈值的所述词向量表示确定为目标词向量;
基于所述目标词向量提取所述目标语句序列中的所述目标词序列。


8.根据权利要求2所述的目标信息显示方法,其特征在于,所述在所述原始文本中,对所述目标语句序列和/或所述目标词...

【专利技术属性】
技术研发人员:裴宏悦
申请(专利权)人:天津开心生活科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1