一种文本衔接性判断方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34753366 阅读:13 留言:0更新日期:2022-08-31 18:49
本发明专利技术实施例涉及计算机技术领域,尤其涉及一种文本衔接性判断方法、装置、电子设备及存储介质。该方法包括:获取目标文本,对目标文本进行解析,得到目标文本的任务关键语段,基于预设的命名实体识别模型及所述任务关键语段,得到任务关键语段中的标签命名实体,基于标签命名实体,确定各个任务关键语段之间的衔接性判断结果。通过在锁定任务关键语段之后,进一步地获得任务关键语段中的标签命名实体,利用这些标签命名实体计算任务关键语段之间的衔接性,明确了在一段文本中,各个语段时间的衔接性关系可以充分的判断出,文本中后文的预案是否能解决前文中的问题,提高了工作效率。率。率。

【技术实现步骤摘要】
一种文本衔接性判断方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种文本衔接性判断方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能的发展,人工智能也可以逐渐理解文本内容。现有技术下,可以利用人工智能来识别文本的相似度,一致性等等。
[0003]但是,现有技术下,人工智能仅能分辨出文本是否在说同一问题,尤其在应急预案领域,对于人工智能的要求不仅限于使其识别文本中是否在说同一问题,更重要的是,需要判断文本中后文的预案是否能解决前文中的问题,这就涉及到了对文本衔接性的判断,判断文本的连贯性和实用性。
[0004]因此,需要一种文本衔接性判断方法,以解决上述问题。

技术实现思路

[0005]鉴于此,为解决现有技术中上述技术问题,本专利技术实施例提供文本衔接性判断方法、装置、电子设备及存储介质。
[0006]第一方面,本专利技术实施例提供文本衔接性判断方法,该方法包括:获取目标文本;对目标文本进行解析,得到目标文本的任务关键语段;基于预设的命名实体识别模型及所述任务关键语段,得到任务关键语段中的标签命名实体;基于标签命名实体,确定各个任务关键语段之间的衔接性判断结果。
[0007]可选地,对目标文本进行解析,得到目标文本的任务关键语段,包括:将目标文本输入值预先设置的初始分析模型,确定初始分析结果;基于预先设置的知识库和初始分析结果,确定至少两个过程语段;利用预先设置的关键短语提取模型对各个过程语段进行关键短语提取,确定关键短语提取结果;根据关键短语提取结果,得到目标文本的任务关键语段。
[0008]可选地,利用预设的关键短语提取模型对各个过程语段进行关键短语提取,确定关键短语提取结果,包括:基于预设的分词模型对过程语段进行分词处理,得到分词结果;基于分词结果,和预设的权重规则,确定各个分词结果对应的权重;基于各个分词结果对应的权重和预先设定的选择规则,确定关键短语提取结果。
[0009]可选地,基于预设的命名实体识别模型及所述任务关键语段,得到任务关键语段中的标签命名实体,包括:将任务关键语段输入至预设的词性标注模型中,确定词性标注结果;基于词性标注结果和预先设置的目标词性,保留符合目标词性的目标词汇;将目标词汇输入至预先设定的命名实体识别模型中,得到任务关键语段中的标签命名实体。
[0010]可选地,基于标签命名实体,确定各个任务关键语段之间的衔接性判断结果,包括:将各个标签命名实体输入至预先设定的语义评估模型,确定各个标签命名实体之间的语义相似度;基于语义相似度,确定标签命名实体之间是否存在连接;获取各个任务关键语
段对应的标签命名实体的连接个数;获取各个任务关键语段对应的标签命名实体的元素个数;基于元素个数和连接个数,确定各个任务关键语段之间的衔接性判断结果。
[0011]可选地,基于语义相似度,确定标签命名实体之间是否存在连接,包括:当语义相似度大于预设的第一阈值时,认定标签命名实体之间存在连接;否则,认定标签命名实体之间不存在连接。
[0012]第二方面,本专利技术实施例提供一种文本衔接性判断装置,包括:获取模块,用于获取目标文本;解析模块,用于对目标文本进行解析,得到目标文本的任务关键语段;第一处理模块,用于基于预设的命名实体识别模型及所述任务关键语段,得到任务关键语段中的标签命名实体;第二处理模块,用于基于标签命名实体,确定各个任务关键语段之间的衔接性判断结果。
[0013]第三方面,本申请提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行如第一方面或第一方面任一可能的实施方式的方法的步骤。
[0014]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面或第一方面任一可能的实施方式的方法的步骤。
[0015]本专利技术提供的文本衔接性判断方法、装置、电子设备及存储介质。该方法包括:获取目标文本,对目标文本进行解析,得到目标文本的任务关键语段,基于预设的命名实体识别模型及所述任务关键语段,得到任务关键语段中的标签命名实体,基于标签命名实体,确定各个任务关键语段之间的衔接性判断结果。通过在锁定任务关键语段之后,进一步地获得任务关键语段中的标签命名实体,利用这些标签命名实体计算任务关键语段之间的衔接性,明确了在一段文本中,各个语段时间的衔接性关系可以充分的判断出,文本中后文的预案是否能解决前文中的问题,提高了工作效率。
附图说明
[0016]图1为本专利技术实施例提供的文本衔接性判断方法流程示意图;图2为本专利技术实施例提供的文本衔接性判断方法示意图;图3为本专利技术实施例提供的文本衔接性判断装置结构示意图;图4为本专利技术实施例提供文本衔接性判断电子设备结构示意图。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]为便于对本专利技术实施例的理解,下面将结合附图以具体实施例做进一步地解释说明,实施例并不构成对本专利技术实施例的限定。
[0019]图1为本专利技术实施例提供的文本衔接性判断方法流程示意图,该方法步骤执行过程,具体可以参见图1所示,该方法包括:
S110,获取目标文本。
[0020]示例性地,目标文本可以是任意类型的文本,包括但不限于:应急预案,抢险救灾职责等等各种类型,在此不做限定,同时文本的数据格式也不做限定,包括但不限于doc、docx等格式的文件。
[0021]在一种可选实施例中,在获得其他格式类型的文件后,也可以通过文件格式转换工具,将目标文本类型转换为docx格式的文件,在之后的处理过程中,对docx格式的文件进行统一处理。
[0022]S120,对目标文本进行解析,得到目标文本的任务关键语段。
[0023]示例性地,在获取目标文本之后,将目标文本输入至预先设置的初始分析模型,确定初始分析结果,基于预先设置的知识库和初始分析结果,确定至少两个过程语段,利用预先设置的关键短语提取模型对各个过程语段进行关键短语提取,确定关键短语提取结果;根据关键短语提取结果,得到目标文本的任务关键语段。
[0024]在一种可选实施例中,预先设置的初始分析模型的作用是通过自上而下顺序读取存储数据的每一个实体属性包含标题索引、标题内容、标题级别、上级标题索引、正文,读取结束后得到平级的实体集合,并将目标文本划分出层次。例如,目标文本中包含有“组织机构和职责”,“监测和预警预报”这两个条目,并且,在“组织机构和职责”条目下有子条目“应急组织机构和职责”,“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本衔接性判断方法,其特征在于,包括:获取目标文本;对所述目标文本进行解析,得到所述目标文本的任务关键语段;基于预设的命名实体识别模型及所述任务关键语段,得到所述任务关键语段中的标签命名实体;基于所述标签命名实体,确定各个所述任务关键语段之间的衔接性判断结果。2.根据权利要求1所述的方法, 其特征在于,所述对所述目标文本进行解析,得到所述目标文本的任务关键语段,包括:将所述目标文本输入至预先设置的初始分析模型,确定初始分析结果;基于预先设置的知识库和所述初始分析结果,确定至少两个过程语段;利用预先设置的关键短语提取模型对各个所述过程语段进行关键短语提取,确定关键短语提取结果;根据所述关键短语提取结果,得到所述目标文本的任务关键语段。3.根据权利要求2所述的方法,其特征在于,所述利用预先设置的关键短语提取模型对各个所述过程语段进行关键短语提取,确定关键短语提取结果,包括:基于预设的分词模型对所述过程语段进行分词处理,得到分词结果;基于所述分词结果,和预设的权重规则,确定各个所述分词结果对应的权重;基于所述各个所述分词结果对应的权重和预先设定的选择规则,确定关键短语提取结果。4.根据权利要求1所述的方法,其特征在于,所述基于预设的命名实体识别模型及所述任务关键语段,得到所述任务关键语段中的标签命名实体,包括:将所述任务关键语段输入至预设的词性标注模型中,确定词性标注结果;基于所述词性标注结果和预先设置的目标词性,保留符合所述目标词性的目标词汇;将所述目标词汇输入至预先设定的命名实体识别模型中,得到所述任务关键语段中的标签命名实体。5.根据权利要求1所述的方法,其特征在于,所述基于所述标签命名实体,确定各个所述任务关键语段之间的衔接性判断结果,包括:将各个所述标签命名实体输入至预先设定的语义评估模型,确定各个所述标签命名实体之间的语义相似度;基于所述语义相似度,...

【专利技术属性】
技术研发人员:徐大用习树峰蒋会春沈赣苏张少标房龄航秦宇张杰凌君张波焦圆圆
申请(专利权)人:深圳市城市公共安全技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1