System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种问答处理方法及装置制造方法及图纸_技高网

一种问答处理方法及装置制造方法及图纸

技术编号:41242090 阅读:2 留言:0更新日期:2024-05-09 23:54
本发明专利技术提供一种问答处理方法及装置。该方法包括:获得输入的问题信息对应的文本向量;将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本;其中,所述向量数据库是通过预先遍历待检索文本对应的文档语义树生成的向量集合得到的;所述待检索文本是基于文本之间的语义关系进行切分得到的;所述文档语义树基于所述待检索文本之间的关联关系进行构建;基于所述关联文本生成相应的答案信息。本发明专利技术提供的问答处理方法,能够快速生成精确的答案信息,有效提高了问答处理的效率和准确度,从而极大提升了用户的使用体验。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体涉及一种问答处理方法及装置。另外,还涉及一种电子设备及处理器可读存储介质。


技术介绍

1、近年来,随着人工智能技术的快速发展,各种文档智能问答方案在人们生产生活中的使用越来越广泛。文档智能问答方案是人工智能应用的重要体现。尤其是,随着大数据时代到来,越来越多的传统业务系统面临数据维度和业务功能维度集成整合的压力。目前,现有的文档智能问答方案通常通过抽取文档的文本内容,按分块大小和分块重叠大小两个参数来切分文本,将切分的文本向量化后,再存储到向量数据库中,在回答问题时,先将问题向量化,再从向量数据库中找出匹配度高的文本。然而,现有的文档智能回答方案中按固定长度切分文本,没有考虑文本之间的语义关联等信息,存在较大的局限性,导致实际的问答处理精度和效率较差。


技术实现思路

1、为此,本专利技术提供一种问答处理方法及装置,以解决现有技术中存在的问答处理方案局限性较高,导致实际的问答处理精度和效率较差的缺陷。

2、第一方面,本专利技术提供一种问答处理方法,包括:

3、获得输入的问题信息对应的文本向量;

4、将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本;其中,所述向量数据库是通过预先遍历待检索文本对应的文档语义树生成的向量集合得到的;所述待检索文本是基于文本之间的语义关系进行切分得到的;所述文档语义树基于所述待检索文本之间的关联关系进行构建;

5、基于所述关联文本生成相应的答案信息。

6、进一步的,所述将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本,具体包括:

7、将所述文本向量输入到所述向量数据库进行向量相似度匹配,获得与所述文本向量之间满足预设相似度条件的初始关联文本;

8、基于所述初始关联文本对应的第一节点,从所述文档语义树中确定与所述第一节点存在关联关系的至少一个第二节点,将所述初始关联文本以及所述第二节点对应的文本作为与所述问题信息对应的至少一个关联文本;其中,所述第一节点和所述第二节点均用于表示基于语义关系切分后的文本。

9、进一步的,在获得输入的问题信息对应的文本向量之前,还包括:

10、对所述待检索文本之间的语义关系进行解析,构建文档语义树;

11、对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息;

12、基于所述待检索文本中的各个文本及其对应的语义概括信息,获得相应的文本块集合;将所述文本块集合输入到预设的嵌入向量模型,获得所述嵌入向量模型输出的对应的向量集合;

13、将所述向量集合和所述文本块集合对应存储到初始向量数据库中,获得所述向量数据库。

14、进一步的,所述基于所述关联文本生成相应的答案信息,具体包括:获得输入的提示语模板;其中,所述提示语模板为用户输入的用于限定当前的问答背景和问答身份的信息模板;

15、基于所述关联文本和所述提示语模板生成提示语,并将所述提示语输入到预设的语义问答模型,生成相应的答案信息。

16、进一步的,所述对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,具体包括:

17、调用预设的语义问答模型对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,并将所述语义概括信息添加到所述文档语义树的节点中。

18、进一步的,所述获得输入的问题信息对应的文本向量,具体包括:

19、获取输入的问题信息,将所述问题信息输入到预设的嵌入向量模型,获得所述嵌入向量模型输出的文本向量。

20、第二方面,本专利技术还提供一种问答处理装置,其特征在于,包括:

21、文本向量获得单元,用于获得输入的问题信息对应的文本向量;

22、关联文本确定单元,用于将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本;其中,所述向量数据库是通过预先遍历待检索文本对应的文档语义树生成的向量集合得到的;所述待检索文本是基于文本之间的语义关系进行切分得到的;所述文档语义树基于所述待检索文本之间的关联关系进行构建;

23、答案信息生成单元,用于基于所述关联文本生成相应的答案信息。

24、进一步的,所述关联文本确定单元,具体用于:

25、将所述文本向量输入到所述向量数据库进行向量相似度匹配,获得与所述文本向量之间满足预设相似度条件的初始关联文本;

26、基于所述初始关联文本对应的第一节点,从所述文档语义树中确定与所述第一节点存在关联关系的至少一个第二节点,将所述初始关联文本以及所述第二节点对应的文本作为与所述问题信息对应的至少一个关联文本;其中,所述第一节点和所述第二节点均用于表示基于语义关系切分后的文本。

27、进一步的,在获得输入的问题信息对应的文本向量之前,还包括:向量数据库构建单元,用于:

28、对所述待检索文本之间的语义关系进行解析,构建文档语义树;

29、对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息;

30、基于所述待检索文本中的各个文本及其对应的语义概括信息,获得相应的文本块集合;将所述文本块集合输入到预设的嵌入向量模型,获得所述嵌入向量模型输出的对应的向量集合;

31、将所述向量集合和所述文本块集合对应存储到初始向量数据库中,获得所述向量数据库。

32、进一步的,所述答案信息生成单元,具体用于:获得输入的提示语模板;其中,所述提示语模板为用户输入的用于限定当前的问答背景和问答身份的信息模板;

33、基于所述关联文本和所述提示语模板生成提示语,并将所述提示语输入到预设的语义问答模型,生成相应的答案信息。

34、进一步的,所述对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,具体包括:

35、调用预设的语义问答模型对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,并将所述语义概括信息添加到所述文档语义树的节点中。

36、进一步的,所述文本向量获得单元,具体用于:

37、获取输入的问题信息,将所述问题信息输入到预设的嵌入向量模型,获得所述嵌入向量模型输出的文本向量。

38、第三方面,本专利技术还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述计算机程序时实现如上述任意一项所述的问答处理方法的步骤。

39、第四方面,本专利技术还提供一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的问答处理方法的步骤。

40、本文档来自技高网...

【技术保护点】

1.一种问答处理方法,其特征在于,包括:

2.根据权利要求1所述的问答处理方法,其特征在于,所述将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本,具体包括:

3.根据权利要求1所述的问答处理方法,其特征在于,在获得输入的问题信息对应的文本向量之前,还包括:

4.根据权利要求1所述的问答处理方法,其特征在于,所述基于所述关联文本生成相应的答案信息,具体包括:

5.根据权利要求3所述的问答处理方法,其特征在于,所述对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,具体包括:

6.根据权利要求1所述的问答处理方法,其特征在于,所述获得输入的问题信息对应的文本向量,具体包括:

7.一种问答处理装置,其特征在于,包括:

8.根据权利要求7所述的问答处理装置,其特征在于,所述关联文本确定单元,具体用于:

9.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任意一项所述的问答处理方法的步骤。

10.一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任意一项所述的问答处理方法的步骤。

...

【技术特征摘要】

1.一种问答处理方法,其特征在于,包括:

2.根据权利要求1所述的问答处理方法,其特征在于,所述将所述文本向量输入到预设的向量数据库进行向量相似度关联匹配,查找出与所述问题信息对应的至少一个关联文本,具体包括:

3.根据权利要求1所述的问答处理方法,其特征在于,在获得输入的问题信息对应的文本向量之前,还包括:

4.根据权利要求1所述的问答处理方法,其特征在于,所述基于所述关联文本生成相应的答案信息,具体包括:

5.根据权利要求3所述的问答处理方法,其特征在于,所述对所述文档语义树进行遍历解析,获得所述待检索文本中各个文本对应的语义概括信息,具体包括:

6...

【专利技术属性】
技术研发人员:张彦功秦飞虎王志杰张熹微范建涛袁瑞峰
申请(专利权)人:奇安信网神信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1