System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种数据处理方法、装置、存储介质及电子设备。
技术介绍
1、目前主流的人机交互系统,比如对话系统(谷歌assistate、百度小度等),主要通过把语音对话转换成文本后,再对文本进行识别,基于识别结果来执行一些操作,比如打开空调,播放音乐等,实现机器与人类的自然语言交互,这是一种典型的单模态交互方式。
2、然而,多模态交互才是人机交互最自然的方式,但是,现有的人机交互系统,在对多模态交互数据处理识别时,识别精准性较低,识别效果差。
技术实现思路
1、本专利技术提供一种数据处理方法、装置、存储介质及电子设备,能提供识别精准性较高的对话处理模型。
2、本申请实施例提供了一种数据处理方法,包括:
3、获取对话样本,所述对话样本中包括多个对话语句;
4、根据所述对话样本确定每个所述对话语句对应的内容特征、以及所述多个对话语句之间的对话关联特征;
5、根据所述内容特征和所述对话关联特征,构建所述对话样本对应的目标图结构;
6、利用所述目标图结构对预设模型进行训练,得到已训练模型。
7、本申请实施例还提供了一种数据处理装置,包括:
8、获取模块,用于获取对话样本,所述对话样本中包括多个对话语句;
9、确定模块,用于根据所述对话样本确定每个所述对话语句对应的内容特征、以及所述多个对话语句之间的对话关联特征;
10、构建模块,用于根据所述内容特征和所
11、训练模块,用于利用所述目标图结构对预设模型进行训练,得到已训练模型。
12、在一些实施方式中,所述对话样本为视频样本,所述确定模块具体用于:
13、从所述视频样本中提取出每个所述对话语句对应的子视频;
14、根据所述子视频确定所述对话语句对应的文本特征、音频特征和图像特征;
15、对所述文本特征、所述音频特征和所述图像特征中的至少两个进行拼接,得到所述内容特征,每个所述对话语句对应一个所述内容特征。
16、在一些实施方式中,所述构建模块具体用于:
17、将每个所述内容特征作为一个节点;
18、根据所述对话关联特征,从所有所述节点中确定每个所述节点对应的关联节点;
19、将各个所述节点与对应的所述关联节点进行连接,以构建所述对话样本对应的目标图结构。
20、在一些实施方式中,所述对话关联特征包括对话顺序和对话逻辑关系,所述构建模块具体用于:
21、按照所述对话顺序对各个所述节点进行排序;
22、获取任意两个处于相邻排序位置的所述节点,且将后一排序位置处的所述节点作为前一排序位置处的所述节点的关联节点;
23、获取任意两个不处于相邻排序位置且对应的所述对话逻辑关系指示为回应关系的所述节点,且将所述回应关系中被回应方对应的所述节点,作为回应方对应的所述节点的关联节点。
24、在一些实施方式中,所述构建模块具体用于:
25、通过有向连接边,将各个所述节点与对应的所述关联节点进行连接,得到所述对话样本对应的图结构,其中,所述有向连接边包括箭头端和非箭头端,且各个所述节点处,所述箭头端连接对应的所述关联节点;
26、根据所述图结构确定目标图结构。
27、在一些实施方式中,所述构建模块具体用于:
28、统计所述图结构中每个所述节点的出度值和入度值,所述出度值为对应节点连接的所述非箭头端的个数,所述入度值为对应节点连接的所述箭头端的个数;
29、根据所述出度值和所述入度值对所述图结构进行更新,得到目标图结构。
30、在一些实施方式中,所述构建模块具体用于:
31、当所述出度值和所述入度值之间的第一差值等于第一阈值时,将对应节点、以及与对应节点连接的所述有向连接边进行删除;
32、当所述入度值小于第二阈值,且所述出度值大于或等于第三阈值时,从与对应节点连接的所述有向连接边中,选取至少一条所述有向连接边进行删除,所述第一阈值小于所述第二阈值,且小于所述第三阈值。
33、在一些实施方式中,所述构建模块具体用于:
34、确定与对应节点连接的其它的所有所述节点,作为候选节点;
35、计算每个所述候选节点的所述入度值和所述出度值之间的第二差值;
36、按照所述第二差值从小到大的顺序,依次删除对应节点与所述候选节点之间的所述有向连接边,直至对应节点的所述出度值等于所述第三阈值。
37、在一些实施方式中,所述预设模型包括特征增强模型和分类模型,该获取模块还用于:获取所述对话样本中每个所述对话语句对应的分类标签;
38、所述训练模块具体用于:利用所述目标图结构和所述分类标签,对所述特征增强模型和所述分类模型进行训练。
39、在一些实施方式中,所述训练模块具体用于:
40、将所述目标图结构输入所述特征增强模型中,得到增强特征信息;
41、将所述增强特征信息输入所述分类模型中,得到预测结果;
42、确定所述预测结果和所述分类标签之间的误差值;
43、根据所述误差值反向调整所述特征增强模型和所述分类模型。
44、在一些实施方式中,所述分类模型包括情绪分类模型和意图分类模型,该数据处理装置还包括识别模块,用于:
45、获取待识别的对话数据;
46、基于所述已训练模型对所述对话数据进行识别,得到目标情绪信息和目标意图信息。
47、本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行上述任一项数据处理方法。
48、本申请实施例还提供了一种电子设备,包括耦合的存储器和处理器,所述存储器存储内有计算机程序,所述处理器用于运行所述存储器内的所述计算机程序,以执行上述任一项数据处理方法。
49、本申请提供的数据处理方法、装置、存储介质及电子设备,通过获取对话样本,对话样本中包括多个对话语句,并根据对话样本确定每个对话语句对应的内容特征和多个对话语句之间的对话关联特征,之后,根据内容特征和对话关联特征,构建对话样本对应的目标图结构,之后,利用目标图结构对预设模型进行训练,从而能结合对话内容和对话关联关系进行模型训练,有效提高模型对对话的识别能力,进而提高人机交互效果。
本文档来自技高网...【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述对话样本为视频样本,所述根据所述对话样本确定每个所述对话语句对应的内容特征,包括:
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述内容特征和所述对话关联特征,构建所述对话样本对应的目标图结构,包括:
4.根据权利要求3所述的数据处理方法,其特征在于,所述对话关联特征包括对话顺序和对话逻辑关系,所述根据所述对话关联特征,从所有所述节点中确定每个所述节点对应的关联节点,包括:
5.根据权利要求3所述的数据处理方法,其特征在于,所述将各个所述节点与对应的所述关联节点进行连接,以构建所述对话样本对应的目标图结构,包括:
6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述图结构确定目标图结构,包括:
7.根据权利要求6所述的数据处理方法,其特征在于,所述根据所述出度值和所述入度值对所述图结构进行更新,包括:
8.根据权利要求7所述的数据处理方法,其特征在于,所述从与对应节点连接的所述有
9.根据权利要求1-8任一项所述的数据处理方法,其特征在于,所述预设模型包括特征增强模型和分类模型,在利用所述目标图结构对预设模型进行训练之前,还包括:
10.根据权利要求9所述的数据处理方法,其特征在于,所述利用所述目标图结构和所述分类标签,对所述特征增强模型和所述分类模型进行训练,包括:
11.根据权利要求9所述的数据处理方法,其特征在于,所述分类模型包括情绪分类模型和意图分类模型,在根据所述目标图结构对预设模型进行训练之后,还包括:
12.一种数据处理装置,其特征在于,包括:
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行权利要求1至11中任一项所述的数据处理方法。
14.一种电子设备,其特征在于,包括耦合的存储器和处理器,所述存储器存储内有计算机程序,所述处理器用于运行所述存储器内的所述计算机程序,以执行权利要求1至11中任一项所述的数据处理方法中的步骤。
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述对话样本为视频样本,所述根据所述对话样本确定每个所述对话语句对应的内容特征,包括:
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述内容特征和所述对话关联特征,构建所述对话样本对应的目标图结构,包括:
4.根据权利要求3所述的数据处理方法,其特征在于,所述对话关联特征包括对话顺序和对话逻辑关系,所述根据所述对话关联特征,从所有所述节点中确定每个所述节点对应的关联节点,包括:
5.根据权利要求3所述的数据处理方法,其特征在于,所述将各个所述节点与对应的所述关联节点进行连接,以构建所述对话样本对应的目标图结构,包括:
6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述图结构确定目标图结构,包括:
7.根据权利要求6所述的数据处理方法,其特征在于,所述根据所述出度值和所述入度值对所述图结构进行更新,包括:
8.根据权利要求7所述的数据处理方法,其特征在于,所述从与对应节点...
【专利技术属性】
技术研发人员:曹源,
申请(专利权)人:TCL科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。