用于输出信息的方法和装置制造方法及图纸

技术编号:21090763 阅读:41 留言:0更新日期:2019-05-11 10:23
本申请实施例公开了用于输出信息的方法和装置。上述方法的一具体实施方式包括:获取目标图像;对目标图像进行目标识别,确定目标图像中包括的对象;基于识别出的对象,生成用于描述目标图像的语句。该实施方式可以对图像进行人脸识别和物体识别,并生成用于描述图像的语句。

【技术实现步骤摘要】
用于输出信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于输出信息的方法和装置。
技术介绍
在日常生活中,猫眼应用广泛,智能猫眼也越来越普及。如果利用猫眼获取的图像进行人物、物体识别,并且对图像进行理解分析,是目前的研究热点。
技术实现思路
本申请实施例提出了用于输出信息的方法和装置。第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取目标图像;对上述目标图像进行目标识别,确定上述目标图像中包括的对象;基于识别出的对象,生成用于描述上述目标图像的语句。在一些实施例中,对象包括人和/或物体;以及上述基于识别出的对象,生成用于描述上述图像集合的语句,包括:确定上述目标图像是否满足以下至少一项条件:包括至少两个人、包括至少一个人和至少一个物体;响应于确定上述目标图像满足以上至少一项条件,确定上述对象之间的距离以及上述对象在上述目标图像中所占的位置;根据上述距离和上述位置,确定上述对象之间的亲密指数;根据上述对象、上述亲密指数,生成用于描述上述目标图像的语句。在一些实施例中,根据上述距离和位置,确定上述对象之间的亲密指数,包括:根据上述距离,确定第一权重系数;根据上述位置,确定上述对象之间的交集面积和并集面积;根据上述交集面积以及上述并集面积,确定第二权重系数;基于上述第一权重系数以及上述第二权重系数,确定上述亲密指数。在一些实施例中,上述根据上述对象、上述亲密指数,生成用于描述上述目标图像的语句,包括:根据上述对象、上述亲密指数,生成至少两个语句;对生成的至少两个语句进行评分,将评分最高的语句作为用于描述上述目标图像的语句。在一些实施例中,上述获取目标图像,包括:响应于检测到预设物体的预设距离内存在对象,确定检测到的对象的停留时间;响应于确定上述停留时间大于或等于预设阈值,利用安装在上述预设物体上的图像采集装置获取包括检测到的对象的图像集合;从上述图像集合中确定出目标图像。在一些实施例中,上述方法还包括:将所生成的语句转换成语音以及输出上述语音。在一些实施例中,上述方法还包括:获取用户的提问语句;根据上述提问语句以及预设的对话库,确定用于回答上述提问语句的回答语句模板;根据上述目标图像、识别出的对象以及上述回答语句模板,得到回答语句;输出上述回答语句。第二方面,本申请实施例提供了一种用于输出信息的装置,包括:图像获取单元,被配置成获取目标图像;对象识别单元,被配置成对上述目标图像进行目标识别,确定上述目标图像中包括的对象;语句生成单元,被配置成基于识别出的对象,生成用于描述上述目标图像的语句。在一些实施例中,对象包括人和/或物体;以及上述语句生成单元包括:判断模块,被配置成确定上述目标图像是否满足以下至少一项条件:包括至少两个人、包括至少一个人和至少一个物体;确定模块,被配置成响应于确定上述目标图像满足以上至少一项条件,确定上述对象之间的距离以及上述对象在上述目标图像中所占的位置;计算模块,被配置成根据上述距离和上述位置,确定上述对象之间的亲密指数;生成模块,被配置成根据上述对象、上述亲密指数,生成用于描述上述目标图像的语句。在一些实施例中,上述计算模块进一步被配置成:根据上述距离,确定第一权重系数;根据上述位置,确定上述对象之间的交集面积和并集面积;根据上述交集面积以及上述并集面积,确定第二权重系数;基于上述第一权重系数以及上述第二权重系数,确定上述亲密指数。在一些实施例中,上述生成模块进一步被配置成:根据上述对象、上述亲密指数,生成至少两个语句;对生成的至少两个语句进行评分,将评分最高的语句作为用于描述上述目标图像的语句。在一些实施例中,上述图像获取单元进一步被配置成:响应于检测到预设物体的预设距离内存在对象,确定检测到的对象的停留时间;响应于确定上述停留时间大于或等于预设阈值,利用安装在上述预设物体上的图像采集装置获取包括检测到的对象的图像集合;从上述图像集合中确定出目标图像。在一些实施例中,上述装置还包括:转换单元,被配置成将所生成的语句转换成语音以及输出上述语音。在一些实施例中,上述装置还包括回答单元,被配置成:获取用户的提问语句;根据上述提问语句以及预设的对话库,确定用于回答上述提问语句的回答语句模板;根据上述目标图像、识别出的对象以及上述回答语句模板,得到回答语句;输出上述回答语句。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面任一实施例所描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。本申请的上述实施例提供的用于输出信息的方法和装置,首先,可以获取目标图像。然后,对目标图像进行人脸识别和物体识别,确定目标图像中包括的对象识别。最后,基于识别出的对象,生成用于描述目标图像的语句。本实施例的方法,可以对图像进行人脸识别和物体识别,并生成用于描述图像的语句。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于输出信息的方法的一个实施例的流程图;图3是根据本申请的用于输出信息的方法的一个应用场景的示意图;图4是根据本申请的用于输出信息的方法的又一个实施例的流程图;图5是根据本申请的用于输出信息的方法的另一个应用场景的示意图;图6是根据本申请的用于输出信息的装置的一个实施例的结构示意图;图7是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以连接有各种电子装置,例如扬声器、图像采集装置等。终端设备101、102、103上可以安装有各种通讯类应用,如图像显示类应用、语音播放类应用。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有拍照功能的各种电子设备,包括但不限于智能猫眼、智能手机、平板电脑、智能相机、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供本文档来自技高网...

【技术保护点】
1.一种用于输出信息的方法,包括:获取目标图像;对所述目标图像进行目标识别,确定所述目标图像中包括的对象;基于识别出的对象,生成用于描述所述目标图像的语句。

【技术特征摘要】
1.一种用于输出信息的方法,包括:获取目标图像;对所述目标图像进行目标识别,确定所述目标图像中包括的对象;基于识别出的对象,生成用于描述所述目标图像的语句。2.根据权利要求1所述的方法,其中,对象包括人和/或物体;以及所述基于识别出的对象,生成用于描述所述图像集合的语句,包括:确定所述目标图像是否满足以下至少一项条件:包括至少两个人、包括至少一个人和至少一个物体;响应于确定所述目标图像满足以上至少一项条件,确定所述对象之间的距离以及所述对象在所述目标图像中所占的位置;根据所述距离和所述位置,确定所述对象之间的亲密指数;根据所述对象、所述亲密指数,生成用于描述所述目标图像的语句。3.根据权利要求2所述的方法,其中,根据所述距离和位置,确定所述对象之间的亲密指数,包括:根据所述距离,确定第一权重系数;根据所述位置,确定所述对象之间的交集面积和并集面积;根据所述交集面积以及所述并集面积,确定第二权重系数;基于所述第一权重系数以及所述第二权重系数,确定所述亲密指数。4.根据权利要求2所述的方法,其中,所述根据所述对象、所述亲密指数,生成用于描述所述目标图像的语句,包括:根据所述对象、所述亲密指数,生成至少两个语句;对生成的至少两个语句进行评分,将评分最高的语句作为用于描述所述目标图像的语句。5.根据权利要求1所述的方法,其中,所述获取目标图像,包括:响应于检测到预设物体的预设距离内存在对象,确定检测到的对象的停留时间;响应于确定所述停留时间大于或等于预设阈值,利用安装在所述预设物体上的图像采集装置获取包括检测到的对象的图像集合;从所述图像集合中确定出目标图像。6.根据权利要求1-5任一项所述的方法,其中,所述方法还包括:将所生成的语句转换成语音以及输出所述语音。7.根据权利要求6所述的方法,其中,所述方法还包括:获取用户的提问语句;根据所述提问语句以及预设的对话库,确定用于回答所述提问语句的回答语句模板;根据所述目标图像、识别出的对象以及所述回答语句模板,得到回答语句;输出所述回答语句。8.一种用于输出信息的装置,包括:图像获取单元,被配置成获取目标图像;对象识别单元,被配置成对所述目标图像进行目标识别,确定所述目标图像中包括的对象;语句生成单元,被配置成基于识别出的对象,生成...

【专利技术属性】
技术研发人员:赖长铃谢攀何健柳瑞超
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1