【技术实现步骤摘要】
一种文本摘要分析方法、装置、电子设备及存储介质
[0001]本专利技术涉及信息处理技术,尤其涉及文本摘要分析方法、装置、电子设备及存储介质。
技术介绍
[0002]文本信息的摘要可以通过简短的文字描述,如新闻、医疗病历、论文、微博、聊天等文本内容,从文本信息中提取关键内容形成摘要,节省用户的文本浏览时间。通过人工智能生成文本摘要是一种高效的解决手段,为此,人工智能技术(AI,Artificial Intelligence)提供了适当的文本处理进程的运行机制来支持上述应用的方案。其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能,在文本处理领域中,可以利用数字计算机或者数字计算机控制的机器实现对文本信息的识别。
[0003]其中,不同的机器学习技术对同一文本所生成的摘要文本并不相同,质量也会有所差异。因此需要科学、准确对摘要文本进行分析,判 ...
【技术保护点】
【技术特征摘要】
1.一种文本摘要分析方法,其特征在于,所述方法包括:获取目标文本以及摘要文本;通过文本信息处理模型对所述摘要文本进行处理,确定所述摘要文本对应的自参照冗余度参数;通过所述文本信息处理模型对所述进行处理,确定所述目标文本对应的伪参照信息;基于所述目标文本对应的伪参照信息,确定与所述目标文本相匹配的中心度加权参数;基于所述摘要文本对应的自参照冗余度参数和所述目标文本相匹配的中心度加权参数,确定所述目标文本与摘要文本的相关度参数;基于所述目标文本与摘要文本的相关度参数,确定所述摘要文本的分析结果。2.根据权利要求1所述的方法,其特征在于,所述通过文本信息处理模型对所述摘要文本进行处理,确定所述摘要文本对应的自参照冗余度参数,包括:通过文本信息处理模型的编码网络对所述摘要文本进行处理,提取与所述摘要文本相匹配的摘要特征向量;根据所述摘要特征向量确定与所述摘要文本所对应的第一词语级的隐向量;对所述第一词语级的隐向量进行最大池化处理,形成第一语句级的隐向量;对所述第一词语级的隐向量和所述第一语句级的隐向量进行拼接,形成第一拼接向量;通过所述第一拼接向量,确定所述第一词语级的隐向量中不同单词之间的相似度;通过所述第一拼接向量,确定所述第一语句级的隐向量中不同语句之间的相似度;通过不同单词之间的相似度和不同语句之间的相似度,确定所述摘要文本对应的自参照冗余度参数。3.根据权利要求1所述的方法,其特征在于,所述通过所述文本信息处理模型对所述目标文本进行处理,确定所述目标文本对应的伪参照信息,包括:根据所述摘要特征向量确定与所述目标文本所对应的第二词语级的隐向量;对所述第二词语级的隐向量进行池化处理,形成第二语句级的隐向量;基于所述第二语句级的隐向量,确定所述目标文本中每个语句所对应的中心度分数;对所述目标文本中每个语句所对应的中心度分数进行排序,根据中心度分数的排序结果确定所述目标文本对应的伪参照信息。4.根据权利要求3所述的方法,其特征在于,所述对所述参照文本中每个语句所对应的中心度分数进行排序,根据中心度分数的排序结果确定所述参照文本对应的伪参照信息,包括:根据文本摘要分析环境,确定所述伪参照信息的单词数量;基于所述伪参照信息的单词数量,在所述中心度分数的排序结果中获取相应数量的语句作为所述目标文本对应的伪参照信息。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本对应的伪参照信息,确定与所述目标文本相匹配的中心度加权参数,包括:对第二词语级的隐向量和第二语句级的隐向量进行拼接,形成第二拼接向量;确定所述目标文本对应的伪参照信息中每个语句和单词所对应的权重参数;
基于所述第二拼接向量和伪参照信息中每个语句和单词所对应的权重参数,确定与所述目标文本相匹配的中心度加权参数。6.根据权利要求5所述的方法,其特征在于,所述确定所述目标文本对应的伪参照信息中每个语句和单词所对应的权重参数,包括:确定所述目标文本中每个语句所对应的中心度分数;对所述目标文本中每个语句所对应的中心度分数进行归一化处理,形成语句级的中心度分数;确定所述伪参照信息中每个单词所归属的语句;根据所述伪参照信息中每个单词所归属的语句的中心度分数;确定词语级的中心度分数;根据所述语句级的中心度分数和所述词语级的中心度分数,确定所述伪参照信息中每个语句和单词所对应的权重参数。7.根据权利要求5所述的方法,其特征在于,所述基于所述第二拼接向量和伪参照信息中每个语句和单词所对应的权重参数,确定与所述目标文本相匹配的中心度加权参数,包括:基于所述第二拼接向量和伪参照信息中每个语句和单词所对应的权重参数,利用所述第一拼接向量,确定所述目标文本对应的准确率参数;通过所述第二拼接向...
【专利技术属性】
技术研发人员:陈旺,李丕绩,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。