【技术实现步骤摘要】
文本摘要生成方法、装置、电子设备及可读存储介质
本专利技术涉及计算机
,更具体地,涉及一种文本摘要生成方法、装置、电子设备及可读存储介质。
技术介绍
随着互联网的发展,人们接收到的数据井喷式上升,因此,如何在海量数据中快速自动提取简洁通顺、并包含关键信息的摘要是目前亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种文本摘要生成方法、装置、电子设备及可读存储介质,以提高文本摘要的精确性和简洁性。第一方面,本专利技术实施例提供一种文本摘要生成方法,所述方法包括:获取目标文本;确定所述目标文本的文档结构图,所述文档结构图用于表征所述目标文本中的词语之间和语句之间的关系;确定所述目标文本中的词语的语义向量;将各所述词语的语义向量和所述文档结构图输入至摘要生成模型中的图网络,以根据各所述词语之间的关系输出各所述词语的结构向量;根据各所述词语的语义向量和结构向量确定各所述词语的目标词向量;根据各所述词语的目标词向量确定所述目标文本的摘要。< ...
【技术保护点】
1.一种文本摘要生成方法,其特征在于,所述方法包括:/n获取目标文本;/n确定所述目标文本的文档结构图,所述文档结构图用于表征所述目标文本中的词语之间和语句之间的关系;/n确定所述目标文本中的词语的语义向量;/n将各所述词语的语义向量和所述文档结构图输入至摘要生成模型中的图网络,以根据各所述词语之间的关系输出各所述词语的结构向量;/n根据各所述词语的语义向量和结构向量确定各所述词语的目标词向量;/n根据各所述词语的目标词向量确定所述目标文本的摘要。/n
【技术特征摘要】
1.一种文本摘要生成方法,其特征在于,所述方法包括:
获取目标文本;
确定所述目标文本的文档结构图,所述文档结构图用于表征所述目标文本中的词语之间和语句之间的关系;
确定所述目标文本中的词语的语义向量;
将各所述词语的语义向量和所述文档结构图输入至摘要生成模型中的图网络,以根据各所述词语之间的关系输出各所述词语的结构向量;
根据各所述词语的语义向量和结构向量确定各所述词语的目标词向量;
根据各所述词语的目标词向量确定所述目标文本的摘要。
2.根据权利要求1所述的方法,其特征在于,根据各所述词语的语义向量和结构向量确定各所述词语的目标词向量包括:
根据各所述词语的语义向量和结构向量确定各所述词语的初始词向量;
根据各所述词语的初始词向量确定所述目标文本的文档向量;
根据所述文档向量和各所述词语的初始词向量确定各所述词语的门向量,所述门向量用于表征对应词语的权重;
根据各所述词语的门向量对各所述词语的初始词向量进行信息过滤,获得各所述词语的目标词向量。
3.根据权利要求1所述的方法,其特征在于,所述摘要生成模型还包括长短时记忆网络,确定所述目标文本中的词语的语义向量包括:
将所述目标文本输入至摘要生成模型中的长短时记忆网络,输出所述目标文本中的词语的语义向量。
4.根据权利要求1所述的方法,其特征在于,所述图网络为图卷积神经网络或图注意力网络。
5.根据权利要求4所述的方法,其特征在于,所述图网络为图卷积神经网络,图卷积神经网络的卷积运算满足以下公式:
其中,σ为图卷积神经网络的激活函数,为第i个节点在第l层卷积层的输出,为第i个节点在第l-1层卷积层的输出,M(i)为第i个节点的相邻节点集合,为可训练参数,其中,第1层卷积层的输入为第i个节点的语义向量。
6.根据权利要求1所述的方法,其特征在于,确定所述目标文本的文档结构图包括:
对所述目标文本中的语句进行分词处理;
对所述语句进行依存关系分析,确定所述语句中的词语之间的依存边;
确定所述目标文本中的相邻语句的邻接边;
对所述目标文本进行指代消解处理,确定指代消解边,所述指代消解边对应的节点表征同一对象;
连接所述目标文本中的相邻语句中的相同词语,确定相同词边。
7.根据权利...
【专利技术属性】
技术研发人员:徐海洋,韩堃,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。