System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种车载VPA形象生成方法、系统、电子设备及存储介质技术方案_技高网

一种车载VPA形象生成方法、系统、电子设备及存储介质技术方案

技术编号:40474789 阅读:7 留言:0更新日期:2024-02-26 19:11
本申请提出一种车载VPA形象生成方法、系统、电子设备及存储介质,通过获取对话状态跟踪信息,根据所述对话状态跟踪信息进行对话决策;根据所述对话决策获取用户意图,根据所述用户意图得到第一槽位信息,根据上传的用户画像,通过面部关键点检测,输出人物特征信息得到默认槽位信息,根据所述第一槽位信息和默认槽位信息的槽位填充结果及模型库,生成所需车载VPA形象。本申请通过定制化的车载VPA形象,更好的满足车主用户个性化需求,提供更加个性化的服务体验,增强用户的情感连接和认同感,同时可以提高交互效率和准确性,更准确地理解用户的语音指令和意图,提供精准的回答和服务。

【技术实现步骤摘要】

本申请涉及vpa生成技术,具体地说,涉及一种车载vpa形象生成方法、系统、电子设备及存储介质。


技术介绍

1、从“软件定义汽车” 出发,汽车主机厂持续在数字化需求的抓取与数字化能力的提升两方面的建立自己的核心优势。经过智能手机对生活习惯的培育,智能座舱转变成为新的流量入口。随着智能座舱相关技术及功能的应用日趋成熟,如何满足不同车主对于汽车产品的差异化需求,比如利用创新的软件订阅模式来并获取收入的“第二增长”曲线。其中订阅的内容除了服务,还可以是彰显车主个性和驾驶体验的ui界面,比如vpa(vehiclepersonal assistant)虚拟形象和车机壁纸。

2、情感化交互是提升用户人机交互体验的重要方向。随着ai和语音识别不断改进,越来越多厂商把vpa形象作为重点,实时渲染的3d形象在情感交互表现力上会更加灵活,匹配用户个性化需求,提高用户使用体验。目前vpa在使用上存在的问题如下:目前vpa形象生成的过程较专业,技术门槛和成本均较高,且实时性较差,同时,不同车机端因产品需求不同,需要开发、适配不同版本的vpa skd,通用性差,开发周期久、成本高,此外,需要通过触屏式交互拉取后台资源进行配置,操作具有一定的复杂和不便。


技术实现思路

1、为解决上述技术问题,本专利技术公开了一种车载vpa形象生成方法、系统、电子设备及存储介质。

2、第一方面,本申请本申请提供一种车载vpa形象生成方法,所述方法包括:

3、s1:获取对话状态跟踪信息;

4、s2: 根据所述对话状态跟踪信息进行对话决策;根据所述对话决策获取用户意图,根据所述用户意图得到第一槽位信息;

5、s3:根据上传的用户画像,通过面部关键点检测,输出人物特征信息得到默认槽位信息;

6、s4:根据所述第一槽位信息和默认槽位信息的槽位填充结果及模型库,生成所需车载vpa形象。

7、优选地,所述步骤s1,具体为:

8、s101:在用户对话开始前,初始化一个上下文存储器,所述上下文存储器用于保存历史对话期间的相关上下文信息;

9、其中,所述相关上下文信息至少包括用户的输入、vpa的回应和对话历史。

10、s102:抓取实时用户对话,提取关键信息,并将所述关键信息与所述历史对话期间的相关上下文信息进行匹配;

11、其中,历史对话至少包括当前对话之前的对话记录。

12、s103:判断匹配是否成功,若是,则将所述实时用户对话和历史对话期间的相关上下文信息作为对话状态跟踪信息;若否,则将所述实时用户对话作为对话状态跟踪信息;

13、s104:所述对话状态跟踪信息更新至所述上下文存储器中作为下一轮判断依据。

14、优选地,所述上下文存储器至少包括记录当前对话轮数、已识别的用户意图以及其他历史对话信息。

15、所述根据所述对话状态跟踪信息进行对话决策,具体为:

16、s201:构建对话决策模型;

17、优选地,所述构建对话策略模型包括:

18、定义对话策略空间:定义对话动作和策略;

19、定义状态表示:将对话状态进行编码和表示,为强化学习算法提供输入;

20、设计建立函数:定义一个奖励函数,用于评估对话策略的好坏;

21、其中,奖励函数能根据预期目标,明确激励对话策略进行正确有效的响应;所述预期目标至少包括用户满意度、任务完成度和回答准确性;

22、强化学习训练:利用强化学习算法进行训练,通过与环境的交互来优化对话策略;

23、模型评估与迭代:通过在实际对话场景中评估训练后的对话策略,收集反馈和改进的机会;根据评估结果,进一步迭代地训练和优化对话策略,以提高对话质量和用户体验。

24、s202:获取当前对话信息和通过所述上下文存储器获取上下文信息;

25、s203:使用对话决策模型将对所述当前对话信息和上下文信息作为输入,预测和选择适当的回应;

26、s204:根据对话决策的结果,生成回应;

27、s205:根据实际对话交互更新至所述上下文存储器以便下一轮对话决策使用。

28、优选地,所述实际对话交互更新将确保vpa能够响应用户在整个对话过程中的不断变化的意图和需求。

29、所述根据所述对话决策获取用户意图,根据所述用户意图得到第一槽位信息,具体为:

30、s210:根据所述上下文存储器获取对话决策和上下文信息;

31、s220:使用神经网络算法训练意图分类模型;

32、s230:通过所述意图分类模型,输入所述对话决策和上下文信息,预测当前的用户意图;

33、s240:识别和提取用户意图中的关键信息;

34、s250:将所述关键信息映射到预定义的槽位中得到第一槽位信息。

35、优选地,所述步骤s3,具体为:

36、s301:预处理用户画像,通过将上传的用户画像进行预处理,所述预处理至少包括图像清晰化、尺寸调整;

37、s302:面部关键点检测,通过利用面部关键点检测算法,对用户画像中的人类进行关键点定位,所述关键点至少包括眼睛、鼻子、嘴巴和下巴;

38、s303:提取人物特征信息,根据检测到的面部关键点,提取与默认槽位信息关联的特征;

39、s304:生成默认槽位信息,根据提取的人物特征信息,结合预先定义好的规则或模型,生成对应的默认槽位信息。

40、优选地,所述步骤s3,还包括:

41、将上传的用户画像与历史用户画像或历史vpa形象进行融合,通过收集和整理用户相关的先验知识,所述先验知识至少包括用户的年龄、职业、性别、地域、用户行为、历史使用习惯、用车场景和时间,进行默认槽位信息的配置。

42、优选地,所述先验知识还可以通过用户注册、用户调查问卷和社交媒体分析方式获取。

43、优选地,所述步骤s4,具体为:

44、根据所述第一槽位信息和默认槽位信息的槽位填充结果,及vpa模型库选取相应的模型组件,通过云端跨模态模型实现车载vpa形象的生成。

45、优选地,所述云端跨模态模型至少包括:

46、2d生成模型:通过用户上传的图像获取的默认槽位信息以及对话管理获取的第一槽位信息生成多个不同视角的视图,然后使用nerf进行重建场景的3d信息;

47、3d生成模型,如3d感知扩散模型rodin,可以通过不同的参数配置,生成数百亿个3d角色变体,其中每个变体包含数百甚至数千个独特的已知值;

48、进一步的,通过获取的默认槽位信息和第一槽位信息,得到槽位值和3d参数,并映射到3d资产库进行匹配或借助3d生成模型生成所需vpa形象。

49、第二方面,本申请提供一种车载vpa形象生成系统,所述系统包括:

本文档来自技高网...

【技术保护点】

1.一种车载VPA形象生成方法,其特征在于,包括:

2.根据权利要求1所述的一种车载VPA形象生成方法,其特征在于,所述步骤S1,具体为:

3.根据权利要求2所述的一种车载VPA形象生成方法,其特征在于,所述根据所述对话状态跟踪信息进行对话决策,具体为:

4.根据权利要求3所述的一种车载VPA形象生成系统的方法,其特征在于,所述根据所述对话决策获取用户意图,根据所述用户意图得到第一槽位信息,具体为:

5.根据权利要求4所述的一种车载VPA形象生成方法,其特征在于,所述步骤S3,具体为:

6.根据权利要求5所述的一种车载VPA形象生成方法,其特征在于,所述步骤S3,还包括:

7.根据权利要求6所述的一种车载VPA形象生成方法,其特征在于,所述步骤S4,具体为:

8.根据权利要求1-7所述的一种车载VPA形象生成方法的系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,

【技术特征摘要】

1.一种车载vpa形象生成方法,其特征在于,包括:

2.根据权利要求1所述的一种车载vpa形象生成方法,其特征在于,所述步骤s1,具体为:

3.根据权利要求2所述的一种车载vpa形象生成方法,其特征在于,所述根据所述对话状态跟踪信息进行对话决策,具体为:

4.根据权利要求3所述的一种车载vpa形象生成系统的方法,其特征在于,所述根据所述对话决策获取用户意图,根据所述用户意图得到第一槽位信息,具体为:

5.根据权利要求4所述的一种...

【专利技术属性】
技术研发人员:郭晓玲王宇华李向阳王武斌
申请(专利权)人:成都市卡蛙科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1