System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自然语言模型的拟人对话方法、装置及电子设备制造方法及图纸_技高网

基于自然语言模型的拟人对话方法、装置及电子设备制造方法及图纸

技术编号:40319328 阅读:11 留言:0更新日期:2024-02-07 21:02
本申请提供一种基于自然语言模型的拟人对话方法、装置及电子设备,涉及计算机技术领域,该方法包括:获取对话过程中的第一文本信息以及对话过程中的第二文本信息,并确定与第一文本信息的技术领域相关的第三文本信息,以及与第一文本信息的话题场景相对应的第四文本信息;将第一文本信息、第二文本信息、第三文本信息、以及第四文本信息进行拼接合并,得到目标文本信息,并将目标文本信息输入自然语言模型,得到与用户当前问题对应的目标回复内容。本申请提供的基于自然语言模型的拟人对话方法及装置,用于提高以自然语言模型LLM驱动的聊天机器人针对专业领域问题的对话生成能力和对话质量,同时,还能使聊天机器人的对话更加拟人化。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种基于自然语言模型的拟人对话方法及装置。


技术介绍

1、随着大语言模型(large language model,llm)技术的发展,以大语言模型llm驱动的新型聊天机器人(chatbot)迅速发展。与传统的对话机器人相比,其对话更加自然和连贯、且更符合人类的思维方式和表达习惯,同时,其智能化水平更高,更加擅长理解和回答各种类型的问题。

2、然而,相关技术中以大语言模型llm驱动的聊天机器人,面向的主要是偏向于闲聊和开放域知识问答的场景,这是由于大语言模型llm的预训练数据大部分来自于互联网,专业领域知识不足,存在不理解领域知识和听不懂专业术语的现象。同时,也存在缺乏特定应用场景下的对话策略,如求职面试、客户服务等场景,大语言模型llm也不具备特定场景下的对话策略能力,容易出现对话不合理、不拟人的现象。


技术实现思路

1、本申请的目的是提供一种基于自然语言模型的拟人对话方法及装置,用于提高以自然语言模型驱动的聊天机器人针对专业领域问题的对话生成能力和对话质量,同时,还能使聊天机器人的对话更加拟人化。

2、本申请提供一种基于自然语言模型的拟人对话方法,包括:

3、获取对话过程中的第一文本信息以及对话过程中的第二文本信息,并确定与所述第一文本信息的
相关的第三文本信息,以及与所述第一文本信息的话题场景相对应的第四文本信息 ;所述第一文本信息包括:用户当前问题;所述第二文本信息包括:所述用户当前问题的上下文信息;所述第三文本信息包括:多个领域知识;所述第四文本信息包括:对话提示模板;将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息,并将所述目标文本信息输入自然语言模型,得到与所述用户当前问题对应的目标回复内容。

4、可选地,所述获取对话过程中的第二文本信息,包括:获取对话过程中的历史对话信息;通过长短时记忆机制从所述历史对话信息中筛选出多个轮次的对话信息,并将所述多个轮次的对话信息确定为所述上下文信息。

5、可选地,所述通过长短时记忆机制从所述历史对话信息中筛选出多个轮次的对话信息,并将所述多个轮次的对话信息确定为所述上下文信息,包括:对所述历史对话信息执行预处理操作,得到处理后的历史对话信息;所述预处理操作用于将同一对象的连续多个对话信息合并为一个对话信息;基于所述用户当前问题,从所述处理后的历史对话信息中筛选出与所述用户当前问题相邻的多个对话轮次的对话信息作为短时记忆对话信息,以及基于所述用户当前问题,从所述处理后的历史对话信息中筛选出与所述用户当前问题相关的多个对话轮次的对话信息作为长时记忆对话信息;将所述长时记忆对话信息以及所述短时记忆对话信息合并后,得到所述上下文信息;其中,所述长时记忆对话信息所包含的对话内容为所述短时记忆对话信息所包含的对话内容之前的对话内容。

6、可选地,所述确定与所述用户当前问题的
相关的多个领域知识,包括:将所述第一文本信息转换为第一语义向量,并基于所述第一语义向量从所述领域知识向量数据库中筛选出与所述第一语义向量相匹配的多个结果信息,并将所述多个结果信息对应的领域知识确定为所述多个领域知识。

7、可选地,所述将所述第一文本信息转换为第一语义向量,并基于所述第一语义向量从所述领域知识向量数据库中筛选出与所述第一语义向量相匹配的多个结果信息,包括:使用预设转换算法将所述第一文本信息转换为所述第一语义向量,并基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度;将所述领域知识向量数据库中相似度值满足预设相似度的多个语义向量确定为所述多个结果信息;其中,所述预设相似度算法包括以下任一项:欧氏距离算法,内积算法。

8、可选地,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:基于以下公式一计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度:

9、(公式一)

10、其中,为所述第一语义向量;为所述领域知识向量数据库中任一领域知识的语义向量。

11、可选地,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:基于以下公式二计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度:

12、(公式二)

13、其中,为所述第一语义向量;为所述领域知识向量数据库中任一领域知识的语义向量。

14、可选地,所述确定与所述第一文本信息的话题场景相对应的第四文本信息,包括:将所述第一文本信息输入至场景分类模型中,确定所述第一文本信息对应的话题场景;基于所述第一文本信息对应的话题场景从对话提示模板库中筛选出话题场景与所述第一文本信息对应的话题场景相匹配的目标提示模板;其中,一个话题场景对应一个对话提示模板。

15、可选地,所述将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息,包括:将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并后,得到待处理文本信息;使用预设分词算法对所述待处理文本信息执行文本分词操作,并计算分词后所述待处理文本信息对应的第一分词数量;在所述待处理文本信息的第一分词数量大于所述自然语言模型所允许输入的最大分词数量的情况下,计算所述最大分词数量与所述第一分词数量的差值,得到分词数量差;以及基于所述分词数量差从所述目标文本信息的头部向尾部进行文本信息的截断,得到靠近头部的第一子文本信息和靠近尾部的第二子文本信息,并将所述第二文本信息确定为所述目标文本信息。

16、可选地,所述使用预设分词算法对所述待处理文本信息执行文本分词操作,并计算分词后所述待处理文本信息对应的第一分词数量之后,所述方法还包括:在所述待处理文本信息的第一分词数量小于或者等于所述自然语言模型所允许输入的最大分词数量的情况下,将所述待处理文本信息确定为所述目标文本信息。

17、可选地,所述将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息,包括:基于与所述多个领域知识以及所述第四文本信息所包含的对话提示模板相匹配的目标拼接顺序,将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息;其中,基于不同的拼接顺序得到的目标文本信息,对应的所述自然语言模型的输出结果不完全相同;所述目标拼接顺序为多个拼接顺序对应的所述自然语言模型的输出结果中,用户满意度评分最高的拼接顺序;所述多个拼接顺序为所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息所对应的拼接顺序。

18、可选地,所述将所述第一文本信息输入至场景分类模型本文档来自技高网...

【技术保护点】

1.一种基于自然语言模型的拟人对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取对话过程中的第二文本信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过长短时记忆机制从所述历史对话信息中筛选出多个轮次的对话信息,并将所述多个轮次的对话信息确定为所述上下文信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述确定与所述用户当前问题的技术领域相关的多个领域知识,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述第一文本信息转换为第一语义向量,并基于所述第一语义向量从所述领域知识向量数据库中筛选出与所述第一语义向量相匹配的多个结果信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:

8.根据权利要求1所述的方法,其特征在于,所述确定与所述第一文本信息的话题场景相对应的第四文本信息,包括:

9.根据权利要求1所述的方法,其特征在于,所述将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息,包括:

10.根据权利要求9所述的方法,其特征在于,所述使用预设分词算法对所述待处理文本信息执行文本分词操作,并计算分词后所述待处理文本信息对应的第一分词数量之后,所述方法还包括:

11.根据权利要求1或9所述的方法,其特征在于,所述将所述第一文本信息、所述第二文本信息、所述第三文本信息、以及所述第四文本信息进行拼接合并,得到目标文本信息,包括:

12.根据权利要求8所述的方法,其特征在于,所述将所述第一文本信息输入至场景分类模型中,确定所述第一文本信息对应的话题场景之前,所述方法还包括:

13.一种基于自然语言模型的拟人对话装置,其特征在于,所述装置包括:

14.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至12任一项所述基于自然语言模型的拟人对话方法的步骤。

15.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述基于自然语言模型的拟人对话方法的步骤。

...

【技术特征摘要】

1.一种基于自然语言模型的拟人对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取对话过程中的第二文本信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过长短时记忆机制从所述历史对话信息中筛选出多个轮次的对话信息,并将所述多个轮次的对话信息确定为所述上下文信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述确定与所述用户当前问题的技术领域相关的多个领域知识,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述第一文本信息转换为第一语义向量,并基于所述第一语义向量从所述领域知识向量数据库中筛选出与所述第一语义向量相匹配的多个结果信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于预设相似度算法计算所述第一语义向量与所述领域知识向量数据库中各个领域知识的语义向量的相似度,包括:

8.根据权利要求1所述的方法,其特征在于,所述确定与所述第一文本信息的话题场景相对应的第四文本信息,包括:

9.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:张辉
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1