基于人工智能的对话方法、装置、终端及存储介质制造方法及图纸

技术编号:29401094 阅读:9 留言:0更新日期:2021-07-23 22:38
本发明专利技术公开了一种基于人工智能的对话方法、装置、终端及存储介质,其中方法包括:当开始与用户进行对话时,依次逐个输出预设话题库中的每个话题,并在每输出一个话题时,采集用户针对于当前话题的语音信息和面部图像信息;利用预先训练好的感兴趣预测模型分析语音信息和面部图像信息,以得到用户对当前话题的感兴趣概率值;当感兴趣概率值达到预设阈值时,输出当前话题的下一话题。通过上述方式,本发明专利技术能够在与用户对话时,同时分析用户的声音和面部图像特征,从而确认用户对当前话题的感兴趣程度,避免向用户抛出用户不感兴趣的话题。

【技术实现步骤摘要】
基于人工智能的对话方法、装置、终端及存储介质
本申请涉及人工智能
,特别是涉及一种基于人工智能的对话方法、装置、终端及存储介质。
技术介绍
对话机器人,又称聊天机器人,或者问答系统,是指能够让人和机器之间,使用自然语言的方式进行沟通交流的软件系统。随着以深度学习为代表的人工智能技术的进步,对话机器人系统,迎来了新一轮的发展热潮。目前,对话机器人一定程度上已经能够理解来自用户的自然语言问题所表达的真实语义,甚至可以结合对话过程中的上下文信息,从而给出最合适的答案。正因为此,对话机器人,已经开始在人们的工作和生活中扮演越来越重要的角色,这也使得对话机器人背后的自然语言处理技术被称为人工智能皇冠上的明珠,成为科研界、企业界持续关注的热点方向。目前,现有市场上的对话机器人主要是根据用户输入的语音信息进行匹配,然后给出相应的答复,而实际上,用户的日常问答过受情绪影响较大,在仅依赖用户的语音信息进行匹配的情况下,机器人给出的答复可能与用户期望的回复差距较大,导致用户丧失对话的兴趣,对话效果不佳。
技术实现思路
本申请提供一种基于人工智能的对话方法、装置、终端及存储介质,以解决现有对话机器人对话效果不佳的技术问题。为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于人工智能的对话方法,包括:当开始与用户进行对话时,依次逐个输出预设话题库中的每个话题,并在每输出一个话题时,采集用户针对于当前话题的语音信息和面部图像信息;利用预先训练好的感兴趣预测模型分析语音信息和面部图像信息,以得到用户对当前话题的感兴趣概率值;当感兴趣概率值达到预设阈值时,输出当前话题的下一话题。作为本申请的进一步改进,利用预先训练好的感兴趣预测模型分析语音信息和面部图像信息,以得到用户对当前话题的感兴趣概率值,包括:从语音信息中提取声纹特征,并从面部图像信息中提取表情特征;将声纹特征输入至声纹预测子模型,得到第一预测概率值,并将表情特征输入至表情预测子模型,得到第二预测概率值;利用第一权重值和第二权重值对第一预测概率值和第二预测概率值进行加权计算,得到感兴趣概率值。作为本申请的进一步改进,得到用户对当前话题的感兴趣概率值之后,还包括:当感兴趣概率值未达到预设阈值时,将语音信息转换为文本信息后,从话题库中查询与文本信息匹配度最高的话题并输出。作为本申请的进一步改进,将语音信息转换为文本信息后,从话题库中查询与文本信息匹配度最高的话题并输出,包括:将语音信息转换为文本信息;从文本信息中提取得到文本特征,并将文本特征输入至预先训练好的文本匹配模型,以与话题库中的每个话题进行匹配,得到匹配度最高的话题;将匹配度最高的话题转换为语音并输出。作为本申请的进一步改进,将语音信息转换为文本信息后,从话题库中查询与文本信息匹配度最高的话题并输出之后,还包括:将当前话题的不感兴趣次数累加一次;每间隔预设时间段,筛选出不感兴趣次数达到预设次数的待替换话题,并提醒工作人员对待替换话题进行更新。作为本申请的进一步改进,输出当前话题的下一话题之后,还包括:获取用户的满意度评价结果,并将满意度评价结果作为历史训练数据对感兴趣预测模型进行训练。作为本申请的进一步改进,方法还包括预先训练感兴趣预测模型,具体包括:获取历史训练数据,历史训练数据包括历史语音信息、历史面部图像信息和真实感兴趣结果;从历史语音信息中提取历史声纹特征,并从历史面部图像信息中提取历史表情特征;将历史声纹特征输入至待训练的声纹预测子模型得到第三预测概率值,并将历史表情特征输入至待训练的表情预测子模型得到第四预测概率值;利用待训练的第一权重值和第二权重值对第三预测概率值和第四预测概率值进行加权计算,得到最终预测概率值;根据最终预测概率值确认预测感兴趣结果,再利用预测感兴趣结果与真实感兴趣结果反向更新声纹预测子模型、表情预测子模型、第一权重值和第二权重值,直至达到预设精度。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种基于人工智能的对话装置,包括:采集模块,用于当开始与用户进行对话时,依次逐个输出预设话题库中的每个话题,并在每输出一个话题时,采集用户针对于当前话题的语音信息和面部图像信息;分析模块,用于利用预先训练好的感兴趣预测模型分析语音信息和面部图像信息,以得到用户对当前话题的感兴趣概率值;输出模块,用于当感兴趣概率值达到预设阈值时,输出当前话题的下一话题。为解决上述技术问题,本申请采用的再一个技术方案是:提供一种终端,该终端包括处理器、与处理器耦接的存储器,存储器中存储有程序指令,程序指令被处理器执行时,使得处理器执行上述中任一项的基于人工智能的对话方法的步骤。为解决上述技术问题,本申请采用的再一个技术方案是:提供一种存储介质,存储有能够实现上述中任一项的基于人工智能的对话方法的程序文件。本申请的有益效果是:本申请的基于人工智能的对话方法通过在与用户进行人机对话时,每当抛出一个话题,采集一次用户针对该话题进行对话时的语音信息和面部图像信息,用以分析用户对当前话题是否感兴趣,当确认用户对当前话题感兴趣时,才会继续抛出当前话题的下一话题以继续进行对话,并同样分析用户对下一个话题的感兴趣程度,从而确认是否继续抛出下下个话题,其通过分析用户的语音信息和面部图像信息,从而获知用户当前的情绪高低,进而在用户对当前的话题感兴趣的情况下才会继续抛出话题,以避免抛出一些用户不感兴趣的话题导致用户产生不耐烦的情绪,保证了对话的流畅,同时也提高了用户体验。附图说明图1是本专利技术第一实施例的基于人工智能的对话方法的流程示意图;图2是本专利技术第二实施例的基于人工智能的对话方法的流程示意图;图3是本专利技术第三实施例的基于人工智能的对话方法的流程示意图;图4是本专利技术第四实施例的基于人工智能的对话方法的流程示意图;图5是本专利技术实施例的基于人工智能的对话装置的功能模块示意图;图6是本专利技术实施例的终端的结构示意图;图7是本专利技术实施例的存储介质的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图本文档来自技高网...

【技术保护点】
1.一种基于人工智能的对话方法,其特征在于,包括:/n当开始与用户进行对话时,依次逐个输出预设话题库中的每个话题,并在每输出一个话题时,采集所述用户针对于当前话题的语音信息和面部图像信息;/n利用预先训练好的感兴趣预测模型分析所述语音信息和所述面部图像信息,以得到所述用户对所述当前话题的感兴趣概率值;/n当所述感兴趣概率值达到预设阈值时,输出所述当前话题的下一话题。/n

【技术特征摘要】
1.一种基于人工智能的对话方法,其特征在于,包括:
当开始与用户进行对话时,依次逐个输出预设话题库中的每个话题,并在每输出一个话题时,采集所述用户针对于当前话题的语音信息和面部图像信息;
利用预先训练好的感兴趣预测模型分析所述语音信息和所述面部图像信息,以得到所述用户对所述当前话题的感兴趣概率值;
当所述感兴趣概率值达到预设阈值时,输出所述当前话题的下一话题。


2.根据权利要求1所述的基于人工智能的对话方法,其特征在于,所述利用预先训练好的感兴趣预测模型分析所述语音信息和所述面部图像信息,以得到所述用户对所述当前话题的感兴趣概率值,包括:
从所述语音信息中提取声纹特征,并从所述面部图像信息中提取表情特征;
将所述声纹特征输入至所述声纹预测子模型,得到第一预测概率值,并将所述表情特征输入至所述表情预测子模型,得到第二预测概率值;
利用第一权重值和第二权重值对所述第一预测概率值和所述第二预测概率值进行加权计算,得到所述感兴趣概率值。


3.根据权利要求1所述的基于人工智能的对话方法,其特征在于,所述得到所述用户对所述当前话题的感兴趣概率值之后,还包括:
当所述感兴趣概率值未达到预设阈值时,将所述语音信息转换为文本信息后,从所述话题库中查询与所述文本信息匹配度最高的话题并输出。


4.根据权利要求3所述的基于人工智能的对话方法,其特征在于,所述将所述语音信息转换为文本信息后,从所述话题库中查询与所述文本信息匹配度最高的话题并输出,包括:
将所述语音信息转换为文本信息;
从所述文本信息中提取得到文本特征,并将所述文本特征输入至预先训练好的文本匹配模型,以与所述话题库中的每个话题进行匹配,得到匹配度最高的话题;
将所述匹配度最高的话题转换为语音并输出。


5.根据权利要求3所述的基于人工智能的对话方法,其特征在于,所述将所述语音信息转换为文本信息后,从所述话题库中查询与所述文本信息匹配度最高的话题并输出之后,还包括:
将所述当前话题的不感兴趣次数累加一次;
每间隔预设时间段,筛选出所述不感兴趣次数达到预设次...

【专利技术属性】
技术研发人员:唐亚
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1