当前位置: 首页 > 专利查询>重庆大学专利>正文

基于生活支援的人机交互方法、电子设备及存储介质技术

技术编号:37701211 阅读:14 留言:0更新日期:2023-06-01 23:45
本申请提供一种基于生活支援的人机交互方法、电子设备及存储介质。方法包括:获取训练数据集,训练数据集包括基于生活支援场景的多条语料数据,每条语料数据包括拼接的至少两段相关联的语料内容;利用训练数据集中的语料数据,对GPT2模型进行自回归训练,得到经过训练的GPT2模型;通过电子设备获取用户的语音或文本数据以作为待识别语料;将待识别语料输入电子设备的应用程序中的经过训练的GPT2模型,得到经过训练的GPT2模型输出的交互结果,交互结果包括与待识别语料对应的应答内容。如此,可以根据生活支援场景进行人机交互,可以应用在老人的生活支援中,以便于为用户用提供便捷的服务。服务。服务。

【技术实现步骤摘要】
基于生活支援的人机交互方法、电子设备及存储介质


[0001]本专利技术涉及人工智能
,具体而言,涉及一种基于生活支援的人机交互方法、电子设备及存储介质。

技术介绍

[0002]在进入二十一世纪以来,人口老龄化已成为世界主要国家需要面对的重要社会问题。统计数据显示,随着医疗保健条件的改善、城市化进程加快以及家庭规模的减小,越来越多的老年人口将面临独自生活的问题。目前,人们对意图识别和对话生成的技术有许多研究,但应用于生活支援场景的研究却很少,无法基于生活支援场景有效地进行人机交互。

技术实现思路

[0003]有鉴于此,本申请实施例的目的在于提供一种基于生活支援的人机交互方法、电子设备及存储介质,能够改善无法基于生活支援场景有效地进行人机交互的问题。
[0004]为实现上述技术目的,本申请采用的技术方案如下:
[0005]第一方面,本申请实施例提供了一种基于生活支援的人机交互方法,所述方法包括:
[0006]获取训练数据集,所述训练数据集包括基于生活支援场景的多条语料数据,每条语料数据包括拼接的至少两段相关联的语料内容;
[0007]利用所述训练数据集中的语料数据,对GPT2模型进行自回归训练,得到经过训练的GPT2模型;
[0008]通过电子设备获取用户的语音或文本数据以作为待识别语料;
[0009]将所述待识别语料输入所述电子设备的应用程序中的所述经过训练的GPT2模型,得到所述经过训练的GPT2模型输出的交互结果,所述交互结果包括与所述待识别语料对应的应答内容。
[0010]结合第一方面,在一些可选的实施方式中,将所述待识别语料输入所述电子设备的应用程序中的所述经过训练的GPT2模型,得到所述经过训练的GPT2模型输出的交互结果,包括:
[0011]若所述待识别语料的文本中存在没有标号的文本,将所述没有标号的文本中的每个词表示成u
i
,所述待识别语料中的所有没有标号的文本表示为U={u1,u2,

,u
n
};
[0012]根据所述电子设备的应用程序中所述经过训练的GPT2模型的预测子任务的第一目标函数,预测与所有没有标号的文本U对应的词,所述第一目标函数为:
[0013][0014]其中,所述第一目标函数用于在给定k个词后,预测下一个词出现的概率;k指上下文窗口大小;Θ指标准语言模型,且Θ的解码器为Transformer,所述Transformer的第一层输入表示为:
[0015]h0=UW
e
+W
p
[0016]其中,W
e
指词嵌入投影,W
p
指位置信息编码,所述Transformer的块结构共有n层,则第l层的输入向量h
l
表示为:
[0017]h
l
=transformer_block(h
l
‑1)V
i
∈[1,n][0018]其中,n为大于1的整数,l为1至n中的任一整数;transformer_block指将上一层的输出作为本层的输入;对所述Transformer中的最后一次输出进行投影,表示为:
[0019][0020]若所述待识别语料的文本中存在有标号的文本,则将所述有标号的文本表示为:长度为m的序列x1,x2,

,x
m
标号为y,m为大于等于1的整数;
[0021]根据所述经过训练的GPT2模型的分类子任务的第二目标函数,预测与所述有标号的文本对应的词,所述第二目标函数表示为:
[0022][0023]其中,所述第二目标函数用于在给定x1,x2,

,x
m
后,预测y的概率;代表长度m的序列在l层Transformer块之后的输出;W
y
表示将序列放入训练好的GPT2模型中到的分类标签,其中,所述经过训练的GPT2模型的分类精度表示为:
[0024][0025]利用经过训练的GPT2模型的整体目标函数,确定所述待识别语料的所述交互结果,其中,所述整体目标函数表示为:L3(C)=L2(C)+λL1(C)。
[0026]结合第一方面,在一些可选的实施方式中,所述方法还包括:
[0027]在接收到界面跳转指令时,基于预先创建的用于界面跳转的映射关系,将当前的第一界面跳转为与所述界面跳转指令对应的第二界面。
[0028]结合第一方面,在一些可选的实施方式中,在接收到界面跳转指令之前,所述方法还包括:
[0029]创建所述第一界面和所述第二界面之间的映射关系。
[0030]结合第一方面,在一些可选的实施方式中,在通过电子设备获取用户的语音或文本数据以作为待识别语料之前,所述方法还包括:
[0031]创建用于登陆所述应用程序的用户界面,所述用户界面包括用于用户登陆和用户注册的第一虚拟按钮。
[0032]结合第一方面,在一些可选的实施方式中,所述方法还包括:
[0033]在所述用户界面创建用于添加联系人的通讯录的第二虚拟按钮。
[0034]结合第一方面,在一些可选的实施方式中,所述方法还包括:
[0035]在所述用户界面创建用于作为备忘录的第三虚拟按钮。
[0036]结合第一方面,在一些可选的实施方式中,所述方法还包括:
[0037]将所述交互结果的文本转换为语音输出。
[0038]第二方面,本申请还提供一种电子设备,所述电子设备包括相互耦合的处理器及存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行上述的方法。
[0039]第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的方法。
[0040]采用上述技术方案的专利技术,具有如下优点:
[0041]在本申请提供的技术方案中,利用基于生活支援场景的多条语料数据作为训练数据集,对GPT2模型进行自回归训练,使得训练后的GPT2模型可以基于生活支援场景有效地进行人机交互。即,经过训练的GPT2模型可以将用户的语音或文本数据作为待识别语料,并输出与待识别语料对应的交互结果,如此,可以根据生活支援场景进行人机交互,可以应用在老人的生活支援中,以便于为用户用提供便捷的服务。
附图说明
[0042]本申请可以通过附图给出的非限定性实施例进一步说明。应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0043]图1为本申请实施例提供的基于生活支援的人机交互方法的流程示意图。
[0044]图2为本申请实施例提供的应用程序中的功能控件的框架示意图。
[0045]图3为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生活支援的人机交互方法,其特征在于,所述方法包括:获取训练数据集,所述训练数据集包括基于生活支援场景的多条语料数据,每条语料数据包括拼接的至少两段相关联的语料内容;利用所述训练数据集中的语料数据,对GPT2模型进行自回归训练,得到经过训练的GPT2模型;通过电子设备获取用户的语音或文本数据以作为待识别语料;将所述待识别语料输入所述电子设备的应用程序中的所述经过训练的GPT2模型,得到所述经过训练的GPT2模型输出的交互结果,所述交互结果包括与所述待识别语料对应的应答内容。2.根据权利要求1所述的方法,其特征在于,将所述待识别语料输入所述电子设备的应用程序中的所述经过训练的GPT2模型,得到所述经过训练的GPT2模型输出的交互结果,包括:若所述待识别语料的文本中存在没有标号的文本,将所述没有标号的文本中的每个词表示成u
i
,所述待识别语料中的所有没有标号的文本表示为U={u1,u2,

,u
n
};根据所述电子设备的应用程序中所述经过训练的GPT2模型的预测子任务的第一目标函数,预测与所有没有标号的文本U对应的词,所述第一目标函数为:其中,所述第一目标函数用于在给定k个词后,预测下一个词出现的概率;k指上下文窗口大小;Θ指标准语言模型,且Θ的解码器为Transformer,所述Transformer的第一层输入表示为:h0=UW
e
+W
p
其中,W
e
指词嵌入投影,W
p
指位置信息编码,所述Transformer的块结构共有n层,则第l层的输入向量h
l
表示为:h
l
=transformer_block(h
l
‑1)V
i
∈[1,n]其中,n为大于1的整数,l为1至n中的任一整数;transformer_block指将上一层的输出作为本层的输入;对所述Transformer中的最后一次输出进行投影,表示为:若所述待识别语料的文本中存在有标号的文本,则将所述有标号的文本表示为:长度为m的序列x1,x2,

...

【专利技术属性】
技术研发人员:苏晓杰朱瑾玉孙少欣关丽娟李睿
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1