一种摘要文本提取方法、装置、存储介质和电子设备制造方法及图纸

技术编号:26650649 阅读:25 留言:0更新日期:2020-12-09 00:49
本申请实施例公开了一种摘要文本提取方法、装置、存储介质和电子设备,所述方法涉及人工智能领域中的自然语言处理方向,包括:搜索得到目标检索字段对应的搜索结果,将多个目标文本中的每个目标文本进行分割,得到多个候选语句,并确定文本作者信息、以及语句相似度,基于文本作者信息确定文本可信度,对语句相似度、以及文本可信度进行融合,以迭代计算重要性指标,基于重要性指标,从多个候选语句中确定目标语句,基于目标语句构建目标检索字段对应的目标摘要文本,并显示目标摘要文本。该方案可以通过从搜索结果中提取语句,并利用提取出的语句构建目标检索字段对应的目标摘要文本,有效提升了搜索准确性。

【技术实现步骤摘要】
一种摘要文本提取方法、装置、存储介质和电子设备
本申请涉及计算机
,具体涉及一种摘要文本提取方法、装置、存储介质和电子设备。
技术介绍
随着互联网医疗问诊平台的发展,很多用户在感觉身体不适时,都会选择医疗搜索以了解相应疾病的诊疗信息。但是,由于现有医疗搜索引擎主要是基于关键字进行搜索,无法有效排除相关度较低的内容,导致搜索准确性较低,使得在医疗搜索过程中可能搜索出误导性甚至错误的信息,出现耽误治疗或者错误治疗等严重后果,因此,如何能够提高搜索准确性是目前亟待解决的问题。
技术实现思路
本申请实施例提供一种摘要文本提取方法、装置、存储介质和电子设备,该方案可以提升搜索准确性。本申请实施例提供一种摘要文本提取方法,包括:基于目标检索字段进行搜索,得到所述目标检索字段对应的搜索结果,所述搜索结果包括多个目标文本;将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句,并确定每个候选语句对应的文本作者信息、以及两两候选语句之间的语句相似度;基于所述文本作者信息确定所述每个候选语句对应的文本本文档来自技高网...

【技术保护点】
1.一种摘要文本提取方法,其特征在于,包括:/n基于目标检索字段进行搜索,得到所述目标检索字段对应的搜索结果,所述搜索结果包括多个目标文本;/n将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句,并确定每个候选语句对应的文本作者信息、以及两两候选语句之间的语句相似度;/n基于所述文本作者信息确定所述每个候选语句对应的文本可信度;/n对所述两两候选语句之间的语句相似度、以及所述文本可信度进行融合,以迭代计算每个所述候选语句对应的重要性指标,所述重要性指标表征所述候选语句对于所述目标检索字段的重要程度;/n基于每个所述候选语句对应的重要性指标,从所述多个候选语句中确定目标语句;/n基于所...

【技术特征摘要】
1.一种摘要文本提取方法,其特征在于,包括:
基于目标检索字段进行搜索,得到所述目标检索字段对应的搜索结果,所述搜索结果包括多个目标文本;
将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句,并确定每个候选语句对应的文本作者信息、以及两两候选语句之间的语句相似度;
基于所述文本作者信息确定所述每个候选语句对应的文本可信度;
对所述两两候选语句之间的语句相似度、以及所述文本可信度进行融合,以迭代计算每个所述候选语句对应的重要性指标,所述重要性指标表征所述候选语句对于所述目标检索字段的重要程度;
基于每个所述候选语句对应的重要性指标,从所述多个候选语句中确定目标语句;
基于所述目标语句构建所述目标检索字段对应的目标摘要文本,并将所述目标摘要文本发送给显示设备,以使所述显示设备显示所述目标摘要文本。


2.根据权利要求1所述的摘要文本提取方法,其特征在于,基于目标检索字段进行搜索,得到所述目标检索字段对应的搜索结果,所述搜索结果包括多个目标文本,包括:
基于目标检索字段进行搜索,得到所述目标检索字段对应的初始搜索结果,所述初始搜索结果包括多个候选文本;
确定每个所述候选文本的文本标题与所述目标检索字段之间的相似度;
基于所述相似度,从所述多个候选文本中确定用于文本提取的多个目标文本。


3.根据权利要求2所述的摘要文本提取方法,其特征在于,确定每个所述候选文本的文本标题与所述目标检索字段之间的相似度,包括:
分别对所述目标检索字段、以及每个所述候选文本的文本标题进行向量编码,得到用于表征所述目标检索字段的检索文本向量、以及用于表征所述文本标题的标题文本向量;
基于所述检索文本向量、以及多个所述标题文本向量,确定每个所述候选文本的文本标题与所述目标检索字段之间的相似度。


4.根据权利要求1所述的摘要文本提取方法,其特征在于,将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句,并确定每个候选语句对应的文本作者信息、以及两两候选语句之间的语句相似度,包括:
将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句;
确定每个所述候选语句对应的文本作者信息、以及用于表征每个所述候选语句的语句向量;
基于所述候选语句的语句向量,确定两两候选语句之间的语句相似度。


5.根据权利要求4所述的摘要文本提取方法,其特征在于,将所述多个目标文本中的每个目标文本进行分割,得到多个候选语句,包括:
将所述多个目标文本合并为整体的目标合成文本;
基于预设标识将所述目标合成文本分割为多个候选语句。


6.根据权利要求4所述的摘要文本提取方法,其特征在于,确定每个所述候选语句对应的文本作者信息、以及用于表征每个所述...

【专利技术属性】
技术研发人员:康战辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1