训练人工智能模型的方法、装置、存储介质及机器人制造方法及图纸

技术编号:19878604 阅读:70 留言:0更新日期:2018-12-22 18:04
一种训练人工智能模型的方法、装置、存储介质及机器人,所述方法包括:响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;获取所述用户对所述服务结果的反馈信息;根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对;当生成的所述训练样本对的数量达到预设阈值时,利用各所述训练样本对更新所述预设人工智能模型。采用本公开的技术方案,可以实现对训练样本对的自动标注,通过标注的训练样本对不断提升人工智能模型的性能,相比于现有技术中通过人工参与训练样本标注的方式,可以缩短人工智能模型的训练周期、降低训练成本、提高训练效率。

【技术实现步骤摘要】
【国外来华专利技术】训练人工智能模型的方法、装置、存储介质及机器人
本公开涉及人工智能
,尤其涉及一种训练人工智能模型的方法、装置、存储介质及机器人。
技术介绍
随着科技的高速发展,人工智能(ArtificialIntelligence,AI)应运而生,其在服务机器人、智能终端、专家系统等各领域得到了广泛应用。为了更好地符合用户的需求,通常需要对人工智能模型进行训练,以不断地提升其性能。现有技术中,需要通过人工采集大量数据并对数据做标注,然后将标注好的数据作为训练样本来训练人工智能模型。然而,采用该方式所需的训练周期较长且成本较高。
技术实现思路
为了克服现有技术中存在的问题,本公开提供一种训练人工智能模型的方法、装置、存储介质及机器人。为了实现上述目的,本公开第一方面提供一种训练人工智能模型的方法,包括:响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;获取所述用户对所述服务结果的反馈信息;根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对;当生成的所述训练样本对的数量达到预设阈值时,利用各所述训练样本对训练所述预设人工智能模型。本公开第二方面提供一种训练人工智能模型的装置,包括:服务响应模块,用于响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;反馈信息获取模块,用于获取所述用户对所述服务结果的反馈信息;标注模块,用于根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对;训练模块,用于当生成的所述训练样本对的数量达到预设阈值时,利用各所述训练样本对训练所述预设人工智能模型。本公开第三方面提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所述方法的步骤。本公开第四方面提供一种机器人运动控制装置,包括:本公开第三方面所述的计算机可读存储介质;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。本公开第五方面提供一种机器人,包括本公开第二方面所述的训练人工智能模型的装置。采用上述技术方案,至少可以达到如下技术效果:基于预设人工智能模型输出与服务请求信息对应的服务结果,获取用户对服务结果的反馈信息对服务请求信息和服务结果进行标注,生成训练样本,并在训练样本对的数量达到预设阈值时,利用各训练样本对训练预设人工智能模型,可以实现对训练样本对的自动标注,通过标注的训练样本对不断提升人工智能模型的性能,相比于现有技术中通过人工参与训练样本标注的方式,可以缩短人工智能模型的训练周期、降低训练成本、提高训练效率。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本公开一示例性实施例示出的一种训练人工智能模型的方法的流程图;图2是根据本公开另一示例性实施例示出的一种训练人工智能模型的方法的流程图;图3是根据本公开一示例性实施例示出的一种训练人工智能模型的装置的框图;图4是根据本公开另一示例性实施例示出的一种训练人工智能模型的装置的框图;图5是根据本公开一示例性实施例示出的一种训练人工智能模型的装置的框图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,本公开的说明书和权利要求书以及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必理解为描述特定的顺序或先后次序。图1是根据本公开一示例性实施例示出的一种训练人工智能模型的方法的流程图,如图1所示,该方法包括以下步骤:在步骤S101中,响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果。在一种实施方式中,服务请求信息可以是文本、语音、图片等形式中的至少一种。响应于用户的服务请求信息,可以根据预设人工智能模型输出与服务请求信息对应的服务结果。值得说明的是,本公开实施例中的人工智能模型可以是基于视觉的物体识别模型、人脸性别识别模型、个性化推荐模型、文本对话模型等等。例如,用户手里拿着一个梨并输入语音“这是什么?”,响应于该服务请求信息,利用基于视觉的物体识别模型可以输出服务结果“梨”。又如,用户输入语音“你知道最新的科幻大片吗?”,响应于该服务请求信息,利用文本对话模型可以输出服务结果“黑镜”。在步骤S102中,获取用户对服务结果的反馈信息。在本公开的实施例中,用户对服务结果的反馈信息可以包括用户的语音、面部表情和肢体动作中的一者或多者。在步骤S103中,根据反馈信息对服务请求信息和服务结果进行标注,生成训练样本对。在一种实施方式中,如图2所示,可以根据反馈信息确定用户的情感倾向,其中,情感倾向包括正向倾向和负向倾向,正向倾向表示用户对服务结果满意,而负向倾向表示用户对服务结果不满意。示例地,对于面部表情,正向倾向可以表现为满意的笑容等,负向倾向可以表现为无奈的笑容、厌恶的表情等;对于语音,正向倾向可以表现为“嗯,没错”、“你太棒了”、“差不多”等,负向倾向可以表现为“不对”等;对于肢体动作,正向倾向可以表现为点头、竖大拇指等,负向倾向可以表现为摇头、摊开双手等。若情感倾向为负向倾向,则可以对服务结果进行修正,并再次获取用户对修正后的服务结果的反馈信息,根据该反馈信息确定用户的情感倾向,直到用户的情感倾向为正向倾向;若情感倾向为正向倾向,则可以根据服务请求信息标注输入样本并根据服务结果标注输出样本,得到训练样本对。例如,以人工智能模型为人脸性别识别模型为例示意,用户输入“你觉得我是男性还是女性?”的服务请求信息,响应于该服务请求信息,基于该人脸性别识别模型输出“男性”这一服务结果,并捕捉到用户很无奈地摊开双手这一反馈信息,通过对用户的肢体动作和面部表情进行融合和分析,可以确定用户情感倾向为负向倾向。此时,输出“女性”这一修正后的服务结果,在确定用户对该服务结果的情感倾向为正向倾向后,将该服务请求信息标注信息“人脸图像”以作为输入样本,根据服务结果标注信息“女性”以作为输出样本,由此得到训练样本对(“人脸图像”,“女性”)。又如,以人工智能模型为个性化推荐模型为例示意,用户输入“给我放首歌吧”的服务请求信息,响应于该服务请求信息,基于个性化推荐模型为用户推荐“歌曲A”这一服务结果,并捕捉到用户不耐烦地说“这个太吵了”这一反馈信息,通过对用户的面部表情和语音进行融合和分析,确定用户的情感倾向为负向倾向。接着,再次向用户推荐“歌曲B”,用户皱着眉头说“节奏有点快”,通过对用户的面部表情和语音进行融合和分析,确定用户的情感倾向为负向倾向。紧接着,再次向用户推荐“歌曲C”,用户露出满意的微小并点头,通过对用户的面部表情和肢体动作进行融合和分析,确定用户的情感倾向为正向倾向,因而将“歌曲A”本文档来自技高网...

【技术保护点】
1.一种训练人工智能模型的方法,其特征在于,包括:响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;获取所述用户对所述服务结果的反馈信息;根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对;当生成的所述训练样本对的数量达到预设阈值时,利用各所述训练样本对更新所述预设人工智能模型。

【技术特征摘要】
【国外来华专利技术】1.一种训练人工智能模型的方法,其特征在于,包括:响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;获取所述用户对所述服务结果的反馈信息;根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对;当生成的所述训练样本对的数量达到预设阈值时,利用各所述训练样本对更新所述预设人工智能模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述反馈信息对所述服务请求信息和所述服务结果进行标注,生成训练样本对,包括:根据所述反馈信息确定所述用户的情感倾向;当所述情感倾向为负向倾向时,对所述服务结果进行修正,并再次执行所述获取所述用户对所述服务结果的反馈信息至根据所述反馈信息确定所述用户的情感倾向的步骤,直至所述用户的情感倾向为正向倾向;当所述情感倾向为正向倾向时,根据所述服务请求信息标注输入样本并根据所述服务结果标注输出样本,得到所述训练样本对,所述训练样本对包括所述输入样本和所述输出样本。3.根据权利要求1所述的方法,其特征在于,所述利用生成的所述训练样本对更新所述预设人工智能模型,包括:获取用于训练所述预设人工智能模型的原始训练样本对;将生成的所述训练样本对和所述原始训练样本对合并后训练,得到新的人工智能模型;使用所述新的人工智能模型替换所述预设人工智能模型。4.根据权利要求1所述的方法,其特征在于,所述利用生成的所述训练样本对更新所述预设人工智能模型,包括:利用生成的所述训练样本对,对所述预设人工智能模型进行迁移训练,生成新的人工智能模型;使用所述新的人工智能模型替换所述预设人工智能模型。5.根据权利要求1~4中任一项所述的方法,其特征在于,所述反馈信息包括以下信息中的一者或多者:语音、面部表情和肢体动作。6.一种训练人工智能模型的装置,其特征在于,包括:服务响应模块,用于响应于用户的服务请求信息,基于预设人工智能模型输出相应的服务结果;反馈信息获取模块,用于获取所述用户对所述服务结果的反馈信息;标注模块,用于根据所述反馈信...

【专利技术属性】
技术研发人员:廉士国刘兆祥
申请(专利权)人:深圳前海达闼云端智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1