文本段落召回方法技术

技术编号:39656578 阅读:30 留言:0更新日期:2023-12-09 11:25
本发明专利技术实施例提供文本段落召回方法

【技术实现步骤摘要】
文本段落召回方法、装置、设备和存储介质


[0001]本专利技术涉及数字医疗及人工智能
,尤其涉及文本段落召回方法

装置

设备和存储介质


技术介绍

[0002]文本召回是指从大规模的文本数据集中根据查询需求快速找到相关性较高的文本数据

文本召回在信息检索

搜索引擎

摘要生成和问答系统等领域得到了广泛的应用,尤其是数字医疗场景

例如,在数字医疗场景中,需要构建医学知识库来存储和管理各种医学相关数据信息,利用文本召回可以帮助构建医学知识库,将医学文本资料进行自然语言处理和分析,从而快速找到相关文本资料

提取出有用信息

[0003]相关技术中常见的文本召回方法是基于问题计算每句文本或每段文本的语义相似度,然后保留语义相似度高的部分

但是这种方式容易丢掉一些关键段落的上下文信息,导致召回内容不完整或不连贯

尤其在医学知识库等场景中,召回内容本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种文本段落召回方法,其特征在于,包括:获取待处理文本和召回提示信息,并将所述待处理文本划分成多个文本段落,所述召回提示信息表征所述待处理文本的召回需求;计算所述文本段落和所述召回提示信息的相似度分值;根据预设距离获取每个所述文本段落的文本影响段落;所述文本影响段落与所述文本段落的段落距离小于或等于所述预设距离;获取每个所述文本影响段落与所述文本段落的影响系数,并根据所述影响系数和所述相似度分值计算得到所述文本段落的召回分值;对所述召回分值进行排序,得到召回排序结果;根据所述召回排序结果选取预设数量个所述文本段落作为所述待处理文本的召回内容
。2.
根据权利要求1所述的一种文本段落召回方法,其特征在于,所述获取每个所述文本影响段落与所述文本段落的影响系数,并根据所述影响系数和所述相似度分值计算得到所述文本段落的召回分值,包括:获取系数权重参数,并根据所述系数权重参数和所述段落距离计算得到所述文本影响段落的所述影响系数;累加每个所述文本影响段落对应的所述影响系数得到综合影响值;根据所述综合影响值和所述相似度分值计算得到所述召回分值
。3.
根据权利要求2所述的一种文本段落召回方法,其特征在于,所述根据所述系数权重参数和所述段落距离计算得到所述文本影响段落的所述影响系数,包括:根据所述系数权重参数和所述段落距离计算得到第一影响值;累加每个所述文本影响段落的所述第一影响值得到第二影响值;根据所述第一影响值和所述第二影响值得到所述影响系数
。4.
根据权利要求2所述的一种文本段落召回方法,其特征在于,所述根据所述综合影响值和所述相似度分值计算得到所述文本段落的召回分值,包括:获取所述文本段落的自影响值,并将所述自影响值和所述综合影响值相加得到相邻影响值;将所述相邻影响值和所述相似度分值相乘,得到所述召回分值
。5.
根据权利要求1所述的一种文本段落召回方法,其特征在于,所述根据所述召回排序结果选取预设数量个所述文本段落作为所述待处理文本的召回内容,包括:获取预设数量,并从所述召回排序结果中选取所述预设数量个所述文本段落构成候选文本集合;根据所述文本段落在所述待处理文本中的段落距离调整所述文本段落在所述候选文本集合中的候选次序;根据所述候选次序拼接所述候选文本集合中所述文本段落得到所述待处理文本的所述召回内容
。6.
根据权利要求1所述的文本段落召回方法,其特征在于,所述计算所述文本段落和所述召回提示信息的相似度...

【专利技术属性】
技术研发人员:殷子墨
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1