System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种电力领域中问句依存解析方法、系统、控制装置及存储介质制造方法及图纸_技高网

一种电力领域中问句依存解析方法、系统、控制装置及存储介质制造方法及图纸

技术编号:41238171 阅读:2 留言:0更新日期:2024-05-09 23:51
本发明专利技术涉及句法依存分析技术领域,具体提供一种电力领域中问句依存解析方法、系统、控制装置及存储介质,所述方法包括:S1:获取电力领域知识问答的历史语义问句,并对所述历史语义问句进行预处理;S2:根据预设的基本实体类型、基本依存关系和数据标注准则对预处理后的历史语义问句进行数据标注;S3:将标注后的历史语义问句解析为CoNLL‑X格式;S4:基于Joint联合模型框架构建问句解析模型;S5:将CoNLL‑X格式的历史语义问句输入到问句解析模型进行训练;S6:使用训练好的问句解析模型对目标语义问句进行预测,得到目标语义问句的实体类型和依存关系;S7:根据预测结果,通过模板挂载构建语义成分。解决了现有技术中对于依存分析存在结果准确性低、分析时间长的技术问题。

【技术实现步骤摘要】

本专利技术涉及句法依存分析,具体提供一种电力领域中问句依存解析方法、系统、控制装置及存储介质


技术介绍

1、电力知识问答能够与用户进行自然语言交互,根据用户问题提供关于电力系统、电气设备、电力安全等方面的答案。电力知识问答不仅可以帮助用户快速了解电力行业的基本概念、原理、规范、技术以提高用户的电力知识基本素养和专业水平,还可以通过多种文字、图片、视频等形式展示电力知识的内容,提升用户体验感。

2、问句理解是电力知识问答系统中的一个重要模块,它的作用是理解用户问句中的意图和需求,为后续的信息检索和答案生成提供依据。问句理解模块直接影响后续模块的处理果,如果问句理解模块不能准确地识别用户的问题类型、关键词、实体、属性等信息,那么信息检索模块就无法找到相关的文档或知识,答案生成模块就无法从文档或知识中抽取或生成正确的答案。问句理解模块的难点在于处理自然语言的多样性、歧义性、隐含性等特点,需要利用多种技术,如规则、统计、机器学习、深度学习等,来提高问句理解的准确性、鲁棒性、可拓展性。

3、目前在电力领域知识问答中,针对用户问句的通用依存分析技术无法准确识别问句的主谓宾、定状补等语言类型,以及问句的语义角色、情感倾向、逻辑关系等信息,进而影响电力领域知识问答效果。通用依存分析是一种句法分析方法,它是根据词汇之间的依存关系,构建出句子句法结构的过程。当前通用依存分析在电力领域中存在一些缺陷,主要有以下几点:依存分析的准确性受到词法分析、词性标注、命名实体识别等前置任务的影响,如果前置任务的结果有误,那么依存分析的结果也会受到干扰;依存分析的效率受到句子长度、复杂度、歧义性等因素的影响,如果句子过于复杂、含有多义词等,那么依存分析的时间和空间成本会增加。


技术实现思路

1、为了克服上述缺陷,提出了本专利技术,解决了现有技术中对于依存分析存在结果准确性低、分析时间长的技术问题。

2、第一方面,本专利技术提供一种电力领域中问句依存解析方法,包括步骤:

3、s1:获取电力领域知识问答的历史语义问句,并对所述历史语义问句进行预处理;

4、s2:根据预设的基本实体类型、基本依存关系和数据标注准则对预处理后的历史语义问句进行数据标注;

5、s3:将标注后的历史语义问句解析为conll-x格式;

6、s4:基于joint联合模型框架构建问句解析模型,所述问句解析模型包括依次连接的n-gram字符嵌入层、编码层和biaffine解码层;

7、s5:将conll-x格式的历史语义问句输入到问句解析模型进行训练;

8、s6:使用训练好的问句解析模型对目标语义问句进行预测,得到目标语义问句的实体类型和依存关系;

9、s7:根据预测结果,通过模板挂载构建语义成分,将核心词、动词、疑问词识别为字符串,将修饰词、条件名、条件值、无关词识别为列表,将辅助修饰词识别为嵌套字典。

10、进一步,所述对所述语义问句进行预处理,包括删除所述语义问句中的html元素、停用词、无效词汇和多余空格。

11、进一步,所述预设的基本实体类型包括核心词、修饰词、比较词、条件名、条件值、谓语动词、疑问词、统计词、标点、无关词以及q标识符。

12、进一步,所述预设的基本依存关系包括核心词→修饰词、核心词→比较词、修饰词→比较词、修饰词→修饰词2、比较词→条件名、比较词→条件值、核心词→谓语动词、谓语动词→疑问词、核心词→统计词、核心词→q标识、q标识→无关词以及q标识→标点。

13、进一步,所述预设的数据标注准则包括:

14、通过依存关系体现主导词与支配词的实体类型;

15、整体逻辑上仅允许一个入度,零个或无数个出度;

16、依存关系遵循有向无环图特性。

17、第二方面,本专利技术提供一种电力领域中问句依存解析系统,包括:

18、获取单元,获取电力领域知识问答的历史语义问句,并对所述历史语义问句进行预处理;

19、标注单元,根据预设的基本实体类型、基本依存关系和数据标注准则对预处理后的历史语义问句进行数据标注;

20、解析单元,将标注后的历史语义问句解析为conll-x格式;

21、模型构建单元,基于joint联合模型框架构建问句解析模型,所述问句解析模型包括依次连接的n-gram字符嵌入层、编码层和biaffine解码层;

22、模型训练单元,将conll-x格式的历史语义问句输入到问句解析模型进行训练;

23、预测单元,使用训练好的问句解析模型对目标语义问句进行预测,得到目标语义问句的实体类型和依存关系;

24、处理单元,根据预测结果,通过模板挂载构建语义成分,将核心词、动词、疑问词识别为字符串,将修饰词、条件名、条件值、无关词识别为列表,将辅助修饰词识别为嵌套字典。

25、第三方面,本专利技术提供一种控制装置,包括处理器和存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行所述一种电力领域中问句依存解析方法。

26、第四方面,本专利技术提供一种计算机可读存储介质,其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行所述的一种电力领域中问句依存解析方法。

27、本专利技术的工作原理和有益效果:

28、在实施本专利技术的技术方案中,采用端到端的神经网络模型训练得到语义问句的问句解析模型,能够满足电力领域中问句解析的需求,由于采用端到端的神经网络模型,省略了前置任务的解析,因此较传统通用的依存解析方法具备更高效率,同时由于采用自定义的成分划分的方式能有效避免因口语化或错别字带来的依存解析问题。

本文档来自技高网...

【技术保护点】

1.一种电力领域中问句依存解析方法,其特征在于,包括步骤:

2.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述对所述语义问句进行预处理,包括删除所述语义问句中的HTML元素、停用词、无效词汇和多余空格。

3.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述预设的基本实体类型包括核心词、修饰词、比较词、条件名、条件值、谓语动词、疑问词、统计词、标点、无关词以及Q标识符。

4.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述预设的基本依存关系包括核心词→修饰词、核心词→比较词、修饰词→比较词、修饰词→修饰词2、比较词→条件名、比较词→条件值、核心词→谓语动词、谓语动词→疑问词、核心词→统计词、核心词→Q标识、Q标识→无关词以及Q标识→标点。

5.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述预设的数据标注准则包括:

6.一种电力领域中问句依存解析系统,其特征在于,包括:

7.一种控制装置,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至5中任一项所述一种电力领域中问句依存解析方法。

8.一种计算机可读存储介质,其中存储有多条程序代码,其特征在于,所述程序代码适于由处理器加载并运行以执行权利要求1至5中任一项所述的一种电力领域中问句依存解析方法。

...

【技术特征摘要】

1.一种电力领域中问句依存解析方法,其特征在于,包括步骤:

2.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述对所述语义问句进行预处理,包括删除所述语义问句中的html元素、停用词、无效词汇和多余空格。

3.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述预设的基本实体类型包括核心词、修饰词、比较词、条件名、条件值、谓语动词、疑问词、统计词、标点、无关词以及q标识符。

4.根据权利要求1所述的一种电力领域中问句依存解析方法,其特征在于,所述预设的基本依存关系包括核心词→修饰词、核心词→比较词、修饰词→比较词、修饰词→修饰词2、比较词→条件名、比较词→条件值、核心词→...

【专利技术属性】
技术研发人员:汪庆宁狄晨黄睿张远来刘兴龙
申请(专利权)人:上海迈能创豪能源科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1