基于大语言模型的具有特定语言风格的数字人制造技术

技术编号:39432614 阅读:12 留言:0更新日期:2023-11-19 16:16
公开了一种基于大语言模型的具有特定语言风格的数字人。其首先获取用户输入的问题文本描述,接着,对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量,然后,以特定性格标签来约束所述问题文本描述语义编码特征向量以得到性格标签语义约束下问题文本描述语义编码特征向量,最后,基于所述性格标签语义约束下问题文本描述语义编码特征向量,生成回答文本。这样,其通过加入性格类别标签信息来使得大语言模型的回答具有特定语言风格,可以提高数字人的对话质量和用户满意度。意度。意度。

【技术实现步骤摘要】
基于大语言模型的具有特定语言风格的数字人


[0001]本公开涉及大语言模型领域,且更为具体地,涉及一种基于大语言模型的具有特定语言风格的数字人。

技术介绍

[0002]随着人工智能技术的发展,数字人作为一种新型的人机交互方式,越来越受到人们的关注和喜爱。
[0003]数字人是指通过大语言模型生成的具有自然语言理解和生成能力的虚拟角色,可以与用户进行自然、流畅、智能的对话。然而,目前的数字人还存在一些问题,比如缺乏个性化的语言风格,导致对话过程中缺乏情感交流和亲和力。
[0004]因此,期待一种基于大语言模型的具有特定语言风格的数字人。

技术实现思路

[0005]有鉴于此,本公开提出了一种基于大语言模型的具有特定语言风格的数字人,其通过加入性格类别标签信息来使得大语言模型的回答具有特定语言风格,可以提高数字人的对话质量和用户满意度。
[0006]根据本公开的一方面,提供了一种基于大语言模型的具有特定语言风格的数字人,其包括:问题文本描述获取模块,用于获取用户输入的问题文本描述;语义分析模块,用于对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量;约束模块,用于以特定性格标签来约束所述问题文本描述语义编码特征向量以得到性格标签语义约束下问题文本描述语义编码特征向量;以及回答文本生成模块,用于基于所述性格标签语义约束下问题文本描述语义编码特征向量,生成回答文本。
[0007]根据本公开的实施例,其首先获取用户输入的问题文本描述,接着,对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量,然后,以特定性格标签来约束所述问题文本描述语义编码特征向量以得到性格标签语义约束下问题文本描述语义编码特征向量,最后,基于所述性格标签语义约束下问题文本描述语义编码特征向量,生成回答文本。这样,其通过加入性格类别标签信息来使得大语言模型的回答具有特定语言风格,可以提高数字人的对话质量和用户满意度。
[0008]根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0009]包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的
示例性实施例、特征和方面,并且用于解释本公开的原理。
[0010]图1示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人的框图。
[0011]图2示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人中所述语义分析模块的框图。
[0012]图3示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人中所述数据预处理单元的框图。
[0013]图4示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人中所述约束模块的框图。
[0014]图5示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人中所述向量提取单元的框图。
[0015]图6示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人的方法的流程图。
[0016]图7示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人的方法的架构示意图。
[0017]图8示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人的应用场景图。
具体实施方式
[0018]下面将结合附图对本公开实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本公开的部分实施例,而不是全部的实施例。基于本公开实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本公开保护的范围。
[0019]如本公开和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
[0020]以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
[0021]另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
[0022]针对上述技术问题,本公开的技术构思为:加入性格类别标签信息来使得大语言模型的回答具有特定语言风格,从而提高数字人的对话质量和用户满意度。
[0023]基于此,图1示出根据本公开的实施例的基于大语言模型的具有特定语言风格的数字人的框图示意图。如图1所示,根据本公开实施例的基于大语言模型的具有特定语言风格的数字人100,包括:问题文本描述获取模块110,用于获取用户输入的问题文本描述;语义分析模块120,用于对所述问题文本描述进行语义分析以得到问题文本描述语义编码特
征向量;约束模块130,用于以特定性格标签来约束所述问题文本描述语义编码特征向量以得到性格标签语义约束下问题文本描述语义编码特征向量;以及,回答文本生成模块140,用于基于所述性格标签语义约束下问题文本描述语义编码特征向量,生成回答文本。
[0024]更具地,在本公开的技术方案中,首先,获取用户输入的问题文本描述。接着,对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量。也就是,捕获所述问题文本描述中所蕴含的能够表征用户提问意图的隐含语义特征。
[0025]在本公开的一个具体示例中,对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量的编码过程,包括:先对所述问题文本描述进行分词处理以得到问题文本描述词的序列;随后,将所述问题文本描述词的序列通过词嵌入层以得到问题文本描述词嵌入向量的序列;再将所述问题文本描述词嵌入向量的序列通过基于转换器模块的上下文编码器以得到问题文本描述语义编码特征向量。
[0026]相应地,如图2所示,所述语义分析模块120,包括:数据预处理单元121,用于对所述问题文本描述进行数据预处理以得到问题文本描述词嵌入向量的序列;以及,语义编码单元122,用于对所述问题文本描述词嵌入向量的序列进行语义编码以得到所述问题文本描述语义编码特征向量。应可以理解,所述语义分析模块120包括两个单元:数据预处理单元121和语义编码单元122。其中,数据预处理单元121用于对问题文本描述进行数据预处理,以得到问题文本描述的词嵌入向量序列,其主要功能包括以下几个方面:分词:将问题文本描述划分为单词或子词的序列,以便进行后续处理;去除停用词:去除常见的无实际含义的词语,如介词、连词等,以减少噪音对后续处理的影响;词嵌入:将每个单词映射为一个高维向量,该向量可以捕捉到单词的语义信息,数据预处理单元将问题文本描述中的每个单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大语言模型的具有特定语言风格的数字人,其特征在于,包括:问题文本描述获取模块,用于获取用户输入的问题文本描述;语义分析模块,用于对所述问题文本描述进行语义分析以得到问题文本描述语义编码特征向量;约束模块,用于以特定性格标签来约束所述问题文本描述语义编码特征向量以得到性格标签语义约束下问题文本描述语义编码特征向量;以及回答文本生成模块,用于基于所述性格标签语义约束下问题文本描述语义编码特征向量,生成回答文本。2.根据权利要求1所述的基于大语言模型的具有特定语言风格的数字人,其特征在于,所述语义分析模块,包括:数据预处理单元,用于对所述问题文本描述进行数据预处理以得到问题文本描述词嵌入向量的序列;以及语义编码单元,用于对所述问题文本描述词嵌入向量的序列进行语义编码以得到所述问题文本描述语义编码特征向量。3.根据权利要求2所述的基于大语言模型的具有特定语言风格的数字人,其特征在于,所述数据预处理单元,包括:问题描述分词处理子单元,用于对所述问题文本描述进行分词处理以得到问题文本描述词的序列;以及问题描述词嵌入子单元,用于将所述问题文本描述词的序列通过词嵌入层以得到所述问题文本描述词嵌入向量的序列。4.根据权利要求3所述的基于大语言模型的具有特定语言风格的数字人,其特征在于,所述语义编码单元,进一步用于:将所述问题文本描述词嵌入向量的序列通过基于转换器模块的上下文编码器以得到所述问题文本描述语义编码特征向量。5.根据权利要求4所述的基于大语言模型的具有特定语言风格的数字人,其特征在于,所述约束模块,包括:特征分布增益单元,用于对所述问题文本描述语义编码特征向量进行特征分布增益以得到优化问题文本描述语义编码特征向量;向量提取单元,用于提取特定性格标签的语义编码特征向量;以及融合单元,用...

【专利技术属性】
技术研发人员:王金鹏贾新宇李玉全焦鹏利
申请(专利权)人:杭州谦贞数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1