一种操作信息确定方法及设备技术

技术编号:36646521 阅读:10 留言:0更新日期:2023-02-18 13:06
本申请实施例公开了一种操作信息确定方法,该方法包括:接收待查询信息,对待查询信息进行分词处理,得到第一词;对操作说明映射表中的操作名进行分词,得到每个操作名的第二词;其中,操作说明映射表表征待处理文本中的操作名与操作信息之间的关系;基于第一词和第二词,确定目标操作名;基于目标操作名和操作说明映射表,从待处理文本中确定待查询信息的目标操作信息,并输出目标操作信息。本申请实施例同时还公开一种操作信息确定设备。施例同时还公开一种操作信息确定设备。施例同时还公开一种操作信息确定设备。

【技术实现步骤摘要】
一种操作信息确定方法及设备


[0001]本申请涉及文档处理领域的操作信息确定技术,尤其涉及一种操作信息确定方法及设备。

技术介绍

[0002]目前,在广泛存在的设备使用说明书、操作手册等电子文档中,包含着大量关于操作的说明文本(简称操作说明或操作信息),这类操作说明是具有很高的应用价值。
[0003]相关技术中,从电子文档中确定目标操作的操作说明时,通过对电子文档中的任一段文本内容进行提炼,确定该段中的操作和操作说明,由用户确认提炼出来的操作说明是否为目标操作的操作说明;若该段中提炼的操作说明不是目标操作的操作说明时,对文档中的下一段文本内容进行提炼直到确定提炼出来的操作说明是目标操作的操作说明;这样每次只能对一段文字进行分析提取操作说明,导致提取目标操作的操作说明(即操作信息)的效率低,且准确率不高。

技术实现思路

[0004]为解决上述技术问题,本申请实施例期望提供一种操作信息确定方法及设备,解决了提取操作信息的效率低且准确率不高的问题。
[0005]本申请的技术方案是这样实现的:
[0006]一种操作信息确定方法,所述方法包括:
[0007]接收待查询信息,对所述待查询信息进行分词处理,得到第一词;
[0008]对操作说明映射表中的操作名进行分词,得到每个操作名的第二词;其中,所述操作说明映射表表征待处理文本中的操作名与操作信息之间的关系;
[0009]基于所述第一词和所述第二词,确定目标操作名;
[0010]基于所述目标操作名和所述操作说明映射表,从所述待处理文本中确定所述待查询信息的目标操作信息,并输出所述目标操作信息。
[0011]上述方案中,所述方法还包括:
[0012]获取待处理文本,并从所述待处理文本中确定第一语句;
[0013]获取所述第一语句的词性关联参数;
[0014]基于所述第一语句的词性关联参数,对所述第一语句进行筛选得到目标语句集合;
[0015]基于所述目标语句集合中的第二语句,确定所述待处理文本的操作说明映射表。
[0016]上述方案中,所述从所述待处理文本中确定第一语句,包括:
[0017]确定所述待处理文本中的语句,并确定所述待处理文本中的语句的词的词性;
[0018]从所述待处理文本中的语句中获取同时具有动词和名词的语句,得到所述第一语句。
[0019]上述方案中,所述获取所述第一语句的词性关联参数,包括:
[0020]获取所述第一语句中的词,并基于所述第一语句中的词构建依存句法分析树;
[0021]基于所述依存句法分析树,确定所述第一语句的词性关联参数。
[0022]上述方案中,所述基于所述第一语句的词性关联参数,对所述第一语句进行筛选得到目标语句集合,包括:
[0023]基于所述词性关联参数,从所述第一语句的词中确定第三词;其中,所述第三词的词性为动词,且所述第一语句中不存在指向所述第三词的词性关联关系;所述第一语句中存在与所述第三词具有动宾关系的词,且不存在与所述第三词具有主谓关系的词;
[0024]基于所述第三词对应的语句,从所述第一语句中确定第三语句;
[0025]基于所述第三语句在所述待处理文本中的位置信息,从所述第三语句中确定所述目标语句集合。
[0026]上述方案中,基于所述第三语句在所述待处理文本中的位置信息,从所述第三语句中确定所述目标语句集合,包括:
[0027]获取每一所述第三语句在所述待处理文本的行号、每一所述第三语句所在段落的首行缩进距离和每一所述第三语句所在的段落号;
[0028]基于所述首行缩进距离、所述行号和所述段落号从所述第三语句中,确定第四语句和所述第四语句之间的指向关系;
[0029]基于所述第四语句之间的指向关系,构建所述第四语句的有向树;
[0030]基于所述有向树,确定所述第四语句之间的层级关系;
[0031]基于所述层级关系和所述第四语句,确定所述目标语句集合。
[0032]上述方案中,所述基于层级关系和所述第四语句,确定所述目标语句集合,包括:
[0033]将所述有向树中的每一节点标记为第一标记;
[0034]针对每一有向树,基于所述层级关系确定具有第一标记的第i节点、具有第一标记的第m节点和具有第一标记的第n节点;其中,所述第m节点的层级大于所述第i节点的层级;所述第n节点的层级与所述第i节点的层级相同;其中,i、m和n均为正整数;
[0035]针对每一有向树,基于所述第i节点对应的语句、所述第m节点对应的语句和所述第n节点对应的语句,对所述每一有向树中的节点进行更新确定多个目标有向树;
[0036]基于所述多个目标有向树的节点对应的语句,确定所述目标语句集合。
[0037]上述方案中,所述针对每一有向树,基于所述第i节点对应的语句、第m节点对应的语句和所述第n节点对应的语句,对所述每一有向树中的节点进行更新确定多个目标有向树,包括:
[0038]确定所述第i节点对应的语句的词,与所述第m节点对应的语句的词的第一词汇共有度;
[0039]确定所述第n节点对应的语句的词,与所述第m节点对应的语句的词的第二词汇共有度;
[0040]基于所述第一词汇共有度和所述第二词汇共有度,确定第三词汇共有度;
[0041]确定所述第i节点对应的语句的词和所述第i节点的父节点对应的语句的词的第四词汇共有度;
[0042]基于所述第三词汇共有度和所述第四词汇共有度,对所述有向树中的节点进行更新,确定所述目标有向树;其中,所述目标有向树的节点对应的语句为所述第二语句。
[0043]上述方案中,所述基于所述目标语句集合中的第二语句,确定所述待处理文本的操作说明映射表,包括:
[0044]从多个所述目标有向树中确定具有相同语句的待选节点,并确定所述待选节点具有的子孙节点的数量;
[0045]从所述待选节点中确定具有的子孙节点的数量最多的目标节点;
[0046]构建所述目标节点对应的语句和所述目标节点的子孙节点对应的语句的标识之间的对应关系,得到操作说明映射表;其中,所述操作说明映射表中所述目标节点对应的语句表征所述操作名;所述操作说明映射表中所述标识表征所述操作名对应的操作信息。
[0047]一种操作信息确定设备,所述设备包括:处理器、存储器和通信总线;
[0048]所述通信总线用于实现处理器和存储器之间的通信连接;
[0049]所述处理器用于执行存储器中的操作信息确定程序,以实现以下步骤:
[0050]接收待查询信息,对所述待查询信息进行分词处理,得到第一词;
[0051]对操作说明映射表中的操作名进行分词,得到每个操作名的第二词;其中,所述操作说明映射表表征待处理文本中的操作名与操作信息之间的关系;
[0052]基于所述第一词和所述第二词,确定目标操作名;
[0053]基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种操作信息确定方法,其特征在于,所述方法包括:接收待查询信息,对所述待查询信息进行分词处理,得到第一词;对操作说明映射表中的操作名进行分词,得到每个操作名的第二词;其中,所述操作说明映射表表征待处理文本中的操作名与操作信息之间的关系;基于所述第一词和所述第二词,确定目标操作名;基于所述目标操作名和所述操作说明映射表,从所述待处理文本中确定所述待查询信息的目标操作信息,并输出所述目标操作信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取待处理文本,并从所述待处理文本中确定第一语句;获取所述第一语句的词性关联参数;基于所述第一语句的词性关联参数,对所述第一语句进行筛选得到目标语句集合;基于所述目标语句集合中的第二语句,确定所述待处理文本的操作说明映射表。3.根据权利要求2所述的方法,其特征在于,所述从所述待处理文本中确定第一语句,包括:确定所述待处理文本中的语句,并确定所述待处理文本中的语句的词的词性;从所述待处理文本中的语句中获取同时具有动词和名词的语句,得到所述第一语句。4.根据权利要求2所述的方法,其特征在于,所述获取所述第一语句的词性关联参数,包括:获取所述第一语句中的词,并基于所述第一语句中的词构建依存句法分析树;基于所述依存句法分析树,确定所述第一语句的词性关联参数。5.根据权利要求2所述的方法,其特征在于,所述基于所述第一语句的词性关联参数,对所述第一语句进行筛选得到目标语句集合,包括:基于所述词性关联参数,从所述第一语句的词中确定第三词;其中,所述第三词的词性为动词,且所述第一语句中不存在指向所述第三词的词性关联关系;所述第一语句中存在与所述第三词具有动宾关系的词,且不存在与所述第三词具有主谓关系的词;基于所述第三词对应的语句,从所述第一语句中确定第三语句;基于所述第三语句在所述待处理文本中的位置信息,从所述第三语句中确定所述目标语句集合。6.根据权利要求5所述的方法,其特征在于,所述基于所述第三语句在所述待处理文本中的位置信息,从所述第三语句中确定所述目标语句集合,包括:获取每一所述第三语句在所述待处理文本的行号、每一所述第三语句所在段落的首行缩进距离和每一所述第三语句所在的段落号;基于所述首行缩进距离、所述行号和所述段落号从所述第三语句中,确定第四语句和所述第四语句之间的指向关系;基于所述第四语句之间的指向关系,构建所述第四语句的有向树;基于所述有向树,确定所述第四语句之间的层级关系;基于所述层级关系和所述第四语句,确定所述目标语句集合。7.根据权利要求6所述的方法,其特征在于,所述基于层级关系和所述第四语句,确定所述...

【专利技术属性】
技术研发人员:蔡敦波
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1