对话内容生成方法、系统、存储介质及装置制造方法及图纸

技术编号:39292790 阅读:9 留言:0更新日期:2023-11-07 11:00
本发明专利技术涉及人机对话技术领域,公开了一种对话内容生成方法、系统、存储介质及装置,该方法包括:将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码,对问句编码和知识图谱编码进行融合,获得融合结果,基于融合结果生成对话问句对应的对话答案;由于本发明专利技术中,通过对预设领域数据库中的实体关系数据进行编码并融入对话问句中,避免了出现答非所问的情况,提升了对话答案的准确度。对话答案的准确度。对话答案的准确度。

【技术实现步骤摘要】
对话内容生成方法、系统、存储介质及装置


[0001]本专利技术涉及人机对话
,尤其涉及一种对话内容生成方法、系统、存储介质及装置。

技术介绍

[0002]目前,随着人工智能技术的发展,各个行业都开始引入新的智能技术提高行业的服务体验。在人机对话场景下需要机器能够识别用户输入的问句,然后机器才能够进行回答。而多轮对话技术更为复杂,需要机器能够对多轮对话的上下文进行跟踪理解,并且回答的内容需要紧扣上下文。
[0003]但是,现有人机对话场景下的多轮对话技术,容易出现答非所问的情况,答案的准确度低。

技术实现思路

[0004]本专利技术的主要目的在于提供一种对话内容生成方法、系统、存储介质及装置,旨在解决现有人机对话场景下的多轮对话技术,容易出现答非所问的情况,答案的准确度低的技术问题。
[0005]为实现上述目的,本专利技术提供一种对话内容生成方法,所述对话内容生成方法包括以下步骤:
[0006]将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码;
[0007]对所述问句编码和所述知识图谱编码进行融合,获得融合结果;
[0008]基于融合结果生成所述对话问句对应的对话答案。
[0009]可选地,所述基于融合结果生成所述对话问句对应的对话答案的步骤,包括:
[0010]基于融合结果从所述预设领域数据库或所述对话问句中选取关键知识点;
[0011]根据所述关键知识点生成所述对话问句对应的对话答案。
>[0012]可选地,所述将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码的步骤,包括:
[0013]通过双向LSTM模型对对话问句进行知识编码,获得问句编码;
[0014]通过Graph Transformer算法模型对预设领域数据库中的实体关系数据进行知识编码,获得知识图谱编码。
[0015]可选地,所述将实体关系数据和对话问句分别进行知识编码,获得知识图谱编码和问句编码的步骤之前,还包括:
[0016]通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据;
[0017]基于所述实体关系数据构建预设领域数据库。
[0018]可选地,所述通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据的步骤之前,还包括:
[0019]对领域知识文本的实体和关系进行标注;
[0020]将标注后的领域知识文本划分为训练集、测试集以及验证集;
[0021]基于所述训练集、所述测试集以及所述验证集对初始关系抽取模型进行训练,获得预设关系抽取模型。
[0022]可选地,所述将标注后的领域知识文本划分为训练集、测试集以及验证集的步骤,包括:
[0023]对标注后的领域知识文本进行数据增强;
[0024]将增强后的领域知识文本划分为训练集、测试集以及验证集。
[0025]可选地,所述预设关系抽取模型包括:BertEncoder模块、SubjectTagger模块以及Relation

Specific Object Taggers模块。
[0026]此外,为实现上述目的,本专利技术还提出一种对话内容生成系统,所述对话内容生成系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的对话内容生成程序,所述对话内容生成程序配置为实现如上文所述的对话内容生成方法。
[0027]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有对话内容生成程序,所述对话内容生成程序被处理器执行时实现如上文所述的对话内容生成方法。
[0028]此外,为实现上述目的,本专利技术还提出一种对话内容生成装置,所述对话内容生成装置包括:所述编码模块,用于将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码;
[0029]所述融合模块,用于对所述问句编码和所述知识图谱编码进行融合,获得融合结果;
[0030]所述生成模块,用于基于融合结果生成所述对话问句对应的对话答案。
[0031]在本专利技术中,公开了将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码,对问句编码和知识图谱编码进行融合,获得融合结果,基于融合结果生成对话问句对应的对话答案;由于本专利技术中,通过对预设领域数据库中的实体关系数据进行编码并融入对话问句中,避免了出现答非所问的情况,提升了对话答案的准确度。
附图说明
[0032]图1是本专利技术实施例方案涉及的硬件运行环境的对话内容生成系统的结构示意图;
[0033]图2为本专利技术对话内容生成方法第一实施例的流程示意图;
[0034]图3为本专利技术对话内容生成方法第二实施例的流程示意图;
[0035]图4为本专利技术对话内容生成方法一实施例的双向LSTM模型的框架图;
[0036]图5为本专利技术对话内容生成方法一实施例的Graph Transformer算法模型的框架图;
[0037]图6为本专利技术对话内容生成方法一实施例的文本生成模块的框架图;
[0038]图7为本专利技术对话内容生成方法第三实施例的流程示意图;
[0039]图8为本专利技术对话内容生成方法一实施例的预设关系抽取模型的框架图;
[0040]图9为本专利技术对话内容生成装置第一实施例的结构框图。
[0041]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0042]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0043]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的对话内容生成系统结构示意图。
[0044]如图1所示,该对话内容生成系统可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本专利技术中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless

Fidelity,Wi

Fi)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM),也可以是稳定的存储器(Non

volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0045]本领域技术人员可以理解,图1中示出的结构并不构成对对话内容生成系统的限定,可以包括比图示更多或本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对话内容生成方法,其特征在于,所述对话内容生成方法包括以下步骤:将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码;对所述问句编码和所述知识图谱编码进行融合,获得融合结果;基于融合结果生成所述对话问句对应的对话答案。2.如权利要求1所述的对话内容生成方法,其特征在于,所述基于融合结果生成所述对话问句对应的对话答案的步骤,包括:基于融合结果从所述预设领域数据库或所述对话问句中选取关键知识点;根据所述关键知识点生成所述对话问句对应的对话答案。3.如权利要求1所述的对话内容生成方法,其特征在于,所述将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码的步骤,包括:通过双向LSTM模型对对话问句进行知识编码,获得问句编码;通过Graph Transformer算法模型对预设领域数据库中的实体关系数据进行知识编码,获得知识图谱编码。4.如权利要求1至3中任一项所述的对话内容生成方法,其特征在于,所述将实体关系数据和对话问句分别进行知识编码,获得知识图谱编码和问句编码的步骤之前,还包括:通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据;基于所述实体关系数据构建预设领域数据库。5.如权利要求4所述的对话内容生成方法,其特征在于,所述通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据的步骤之前,还包括:对领域知识文本的实体和关系进行标注;将标注后的领域知识文本划分为训练集、测试集以...

【专利技术属性】
技术研发人员:宋冬冬严昱超彭庆李海传丛鹏宇
申请(专利权)人:中国移动浙江创新研究院有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1