【技术实现步骤摘要】
文本的表达方法、装置、电子设备及可读存储介质
涉及计算机
,具体涉及深度学习
和自然语言处理
,尤其涉及一种文本的表达方法、装置、电子设备及可读存储介质。
技术介绍
随着基于深度学习的表达学习技术的发展,自然语言处理领域很多问题都归结于文本的表达学习,即如何通过表达学习的相关方法,将文本片段,例如词语、句子、文章等表达为一个连续的低维向量。通常,可以将文本切分为多个片段,对每个片段进行表达计算,进而再进一步融合各个片段的表达,作为文本的表达。然而,由于只考虑文本的线性特征所进行的顺序表达,可能会使得所获得的文本表达在语义上存在缺失,从而导致了文本表达的可靠性的降低。
技术实现思路
本申请的多个方面提供一种文本的表达方法、装置、电子设备及可读存储介质,用以提高文本表达的可靠性。根据第一方面,提供了一种文本的表达方法,包括:根据待表达文本的文本结构信息,获得所述待表达文本的图结构;利用结点表达模型,获得所述待表达文本的图结构中各结点的向量表达;根据所述待表达文本的图结构中各结点的向量表达,利用图结构表达模型,获得所述待表达文本的图结构的向量表达,以作为所述待表达文本的向量表达。根据第二方面,提供了一种文本的表达装置,包括:图结构获得单元,用于根据待表达文本的文本结构信息,获得所述待表达文本的图结构;结点表达单元,用于利用结点表达模型,获得所述待表达文本的图结构中各结点的向量表达;图结构表达单元,根据所述待表达文本 ...
【技术保护点】
1.一种文本的表达方法,包括:/n根据待表达文本的文本结构信息,获得所述待表达文本的图结构;/n利用结点表达模型,获得所述待表达文本的图结构中各结点的向量表达;/n根据所述待表达文本的图结构中各结点的向量表达,利用图结构表达模型,获得所述待表达文本的图结构的向量表达,以作为所述待表达文本的向量表达。/n
【技术特征摘要】
1.一种文本的表达方法,包括:
根据待表达文本的文本结构信息,获得所述待表达文本的图结构;
利用结点表达模型,获得所述待表达文本的图结构中各结点的向量表达;
根据所述待表达文本的图结构中各结点的向量表达,利用图结构表达模型,获得所述待表达文本的图结构的向量表达,以作为所述待表达文本的向量表达。
2.根据权利要求1所述的方法,其中,所述根据待表达文本的文本结构信息,获得所述待表达文本的图结构,包括:
根据所述待表达文本的文本内容信息,将所述待表达文本中的特定内容,表示成所述待表达文本的图结构的各结点;
根据所述待表达文本的文本结构信息,将所述待表达文本中的特定内容之间的结构关系,表示成所述待表达文本的图结构的各结点之间的边。
3.根据权利要求1所述的方法,其中,所述利用结点表达模型,获得所述待表达文本的图结构中各结点的向量表达之前,还包括:
根据各样本文本的文本内容信息,将所述各样本文本中的特定内容,表示成所述各样本文本的图结构的各结点;
根据所述各样本文本的文本结构信息,将所述各样本文本中的特定内容之间的结构关系,表示成所述各样本文本的图结构的各结点之间的边;
利用所述各样本文本的图结构,对所述结点表达模型和所述利用图结构表达模型进行训练,以构建所述结点表达模型和所述图结构表达模型。
4.根据权利要求3所述的方法,其中,所述利用所述各样本文本的图结构,对所述结点表达模型和所述利用图结构表达模型进行训练,以构建所述结点表达模型和利用图结构表达模型,包括:
对第一样本文本的图结构中结点进行随机掩盖处理,以分别获得所述第一样本文本的第二图结构和所述第一样本文本的第三图结构;
随机获取第二样本文本的图结构;
利用所述结点表达模型,分别获得所述第一样本文本的第二图结构中各结点的向量表达、所述第一样本文本的第三图结构中各结点的向量表达和所述第二样本文本的图结构中各结点的向量表达;
根据所述第一样本文本的第二图结构中各结点的向量表达、所述第一样本文本的第三图结构中各结点的向量表达和所述第二样本文本的图结构中各结点的向量表达,利用图结构表达模型,分别获得所述第一样本文本的第二图结构的向量表达、所述第一样本文本的第三图结构的向量表达和所述第二样本文本的图结构的向量表达;
根据所述第一样本文本的第二图结构的向量表达、所述第一样本文本的第三图结构的向量表达和所述第二样本文本的图结构的向量表达,对所述结点表达模型和所述图结构表达模型进行训练,以构建所述结点表达模型和所述图结构表达模型。
5.根据权利要求4所述的方法,其中,所述根据所述第一样本文本的第二图结构的向量表达、所述第一样本文本的第三图结构的向量表达和所述第二样本文本的图结构的向量表达,对所述结点表达模型和所述图结构表达模型进行训练,以构建所述结点表达模型和所述图结构表达模型,包括:
根据所述第一样本文本的第二图结构的向量表达和所述第一样本文本的第三图结构的向量表达,获得所述第一样本文本的第二图结构的向量表达与所述第一样本文本的第三图结构的向量表达之间的第一相似函数;
根据所述第一样本文本的第二图结构的向量表达和所述第二样本文本的图结构的向量表达,获得所述第一样本文本的第二图结构的向量表达与所述第二样本文本的图结构的向量表达之间的第二相似函数;
根据所述第一相似函数和所述第二相似函数的损失函数,对所述结点表达模型和所述图结构表达模型进行训练,以构建所述结点表达模型和所述图结构表达模型。
6.根据权利要求1-5中任一项所述的方法,其中,所述待表达文本的文本结构信息包括所述待表达文本内的结构信息和所述待表达文本外的结构信息中的至少一项。
7.一种文本的表达装置,包括:
图结构获得单元,用于根据待...
【专利技术属性】
技术研发人员:刘佳祥,冯仕堃,王硕寰,黄世维,何径舟,孙宇,吴华,王海峰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。