System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种业务执行方法、装置、存储介质以及电子设备。
技术介绍
1、近年来,随着计算机行业的迅速发展,问答模型的应用正在以前所未有的速度扩展。
2、目前,为了构建拥有处理领域知识的能力的问答模型,可以首先采用人工标注的方式来构建针对领域知识的标注数据集,进而,通过标注数据集对问答模型进行训练,以得到拥有处理领域知识能力的问答模型。但是,上述方式所需的人力成本较高且构建标注数据集的效率较低,进而导致问答模型的训练效率较低。
3、因此,如何降低构建拥有处理领域知识能力的问答模型的成本以及提高问答模型的训练效率,是一个亟待解决的问题。
技术实现思路
1、本说明书提供了一种业务执行方法、装置、存储介质以及电子设备,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种业务执行方法,包括:
4、获取文本数据,所述文本数据中包含有指定领域的知识信息;
5、将所述文本数据进行切分,得到各文本数据段以及各文本数据段对应的文本数据段向量,并根据各文本数据段,确定各组合文本数据段;
6、针对每个组合文本数据段,获取针对该组合文本数据段的提示语句,将针对该组合文本数据段的提示语句输入预设的目标模型,以使所述目标模型生成针对该组合文本数据段的各预设问题,作为各标注问题;
7、针对每个标注问题,确定该标注问题的标注问题向量,并根据该标注问题向量与各文本数
8、针对每个标注问题,根据该标注问题的相关领域知识信息,确定针对该标注问题的提示语句,并将该标注问题以及该标注问题的提示语句输入所述目标模型,以使所述目标模型生成针对该标注问题的预设回答,作为标注回答;
9、根据所述标注问题以及所述标注回答,构建标注文本数据集,并根据所述标注文本数据集对问答模型进行训练,以根据训练后的问答模型执行问答业务。
10、可选地,确定各组合文本数据段,具体包括:
11、针对每个文本数据段,获取该文本数据段的相邻文本数据段,并将该文本数据段与该文本数据段的相邻文本数据段进行拼接,得到针对该文本数据段的组合文本数据段。
12、可选地,获取针对该组合文本数据段的提示语句,具体包括:
13、将该组合文本数据段与所述文本数据进行拼接,并将拼接后的数据作为针对该组合文本数据段的提示语句。
14、可选地,根据该标注问题向量与各文本数据段对应的文本数据段向量间的向量距离,确定该标注问题对应的相关领域知识信息,具体包括:
15、将与该标注问题向量之间的向量距离满足预设条件的文本数据段向量作为目标文本数据段向量;
16、根据所述目标文本数据段向量,从构建出的向量数据库表中查询出与所述目标数据段向量相匹配的组合文本数据段,作为针对该标注问题的相关领域知识信息。
17、可选地,构建向量数据库表,具体包括:
18、针对每个组合文本数据段,以该组合文本数据段对应的文本数据段的文本数据段向量作为索引,将该组合文本数据段存入向量数据库表中,以构建出所述向量数据库表;
19、根据所述目标文本数据段向量,从构建出的向量数据库表中查询出与所述目标数据段向量相匹配的组合文本数据段,作为针对该标注问题的相关领域知识信息,具体包括:将所述目标文本数据段向量与所述向量数据库表中的各文本数据段向量进行匹配,以从所述向量数据库表中查询出与所述目标文本数据段向量相匹配的文本数据段向量对应的组合文本数据段,作为针对该标注问题的相关领域知识信息。
20、可选地,针对每个标注问题,根据该标注问题的相关领域知识信息,确定针对该标注问题的提示语句,具体包括:
21、针对每个标注问题,将该标注问题与该标注问题的相关领域知识信息进行拼接,以得到针对该标注问题的提示语句。
22、可选地,根据所述标注文本数据集对问答模型进行训练,具体包括:
23、将所述标注文本数据集中包含的标注问题作为输入问题输入到所述问答模型,以使所述问答模型输出针对所述输入问题的预测回答;
24、以最小化所述预测回答与所述输入问题对应的标注回答之间的偏差为优化目标,对所述问答模型进行训练。
25、本说明书提供了一种业务执行装置,包括:
26、获取模块:用于获取文本数据,所述文本数据中包含有指定领域的知识信息;
27、切分模块:用于将所述文本数据进行切分,得到各文本数据段以及各文本数据段对应的文本数据段向量,并根据各文本数据段,确定各组合文本数据段;
28、第一生成模块:用于针对每个组合文本数据段,获取针对该组合文本数据段的提示语句,将针对该组合文本数据段的提示语句输入预设的目标模型,以使所述目标模型生成针对该组合文本数据段的各预设问题,作为各标注问题;
29、确定模块:用于针对每个标注问题,确定该标注问题的标注问题向量,并根据该标注问题向量与各文本数据段对应的文本数据段向量间的向量距离,确定该标注问题对应的相关领域知识信息;
30、第二生成模块:用于针对每个标注问题,根据该标注问题的相关领域知识信息,确定针对该标注问题的提示语句,并将该标注问题以及该标注问题的提示语句输入所述目标模型,以使所述目标模型生成针对该标注问题的预设回答,作为标注回答;
31、执行模块:用于根据所述标注问题以及所述标注回答,构建标注文本数据集,并根据所述标注文本数据集对问答模型进行训练,以根据训练后的问答模型执行问答业务。
32、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述业务执行方法。
33、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述业务执行方法。
34、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
35、本说明书提供的业务执行方法,首先获取文本数据,对文本数据切分,得到各文本数据段以及对应的文本数据段向量,并根据文本数据段,确定组合文本数据段,获取组合文本数据段的提示语句并输入预设的目标模型,以使目标模型生成各标注问题,确定标注问题的标注问题向量,并根据标注问题向量与各文本数据段对应的文本数据段向量间的向量距离,确定标注问题对应的相关领域知识信息,并通过将标注问题以及确定出的标注问题的提示语句输入目标模型,以使目标模型生成针对标注问题的标注回答,并通过构建的标注文本数据集对问答模型进行训练,以根据训练后的问答模型执行问答业务。
36、从上述方法中可以看出,在构建拥有处理领域知识的能力的问答模型过程中,可以通过将针对组合文本数据段的提示语句输入目标模型的方本文档来自技高网...
【技术保护点】
1.一种业务执行方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,确定各组合文本数据段,具体包括:
3.如权利要求1所述的方法,其特征在于,获取针对该组合文本数据段的提示语句,具体包括:
4.如权利要求1所述的方法,其特征在于,根据该标注问题向量与各文本数据段对应的文本数据段向量间的向量距离,确定该标注问题对应的相关领域知识信息,具体包括:
5.如权利要求4所述的方法,其特征在于,构建向量数据库表,具体包括:
6.如权利要求1所述的方法,其特征在于,针对每个标注问题,根据该标注问题的相关领域知识信息,确定针对该标注问题的提示语句,具体包括:
7.如权利要求1所述的方法,其特征在于,根据所述标注文本数据集对问答模型进行训练,具体包括:
8.一种业务执行装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在
...【技术特征摘要】
1.一种业务执行方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,确定各组合文本数据段,具体包括:
3.如权利要求1所述的方法,其特征在于,获取针对该组合文本数据段的提示语句,具体包括:
4.如权利要求1所述的方法,其特征在于,根据该标注问题向量与各文本数据段对应的文本数据段向量间的向量距离,确定该标注问题对应的相关领域知识信息,具体包括:
5.如权利要求4所述的方法,其特征在于,构建向量数据库表,具体包括:
6.如权利要求1所述的方法,其特征在于,针对每个标注问题,根据该标...
【专利技术属性】
技术研发人员:聂旗,邱鹏,杨炜炜,陈韬,纪政,杜锦,张健,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。