样本数据获取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22689402 阅读:19 留言:0更新日期:2019-11-30 03:51
本发明专利技术公开了一种样本数据获取方法、装置、计算机设备及存储介质,在获取待识别图像之后,根据所述待识别图像组成待验证信息;将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;监控所述验证端返回的识别数据的数量;若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;将所述待识别图像和所述数据标签组成样本数据。通过智能地为待识别图像生成数据标签,并且组成样本数据,可以避免大量地数据标注工作,而且通过智能形成数据标签的方式,也保证了样本数据的准确性。

Sample data acquisition method, device, computer equipment and storage medium

The invention discloses a sample data acquisition method, device, computer equipment and storage medium. After acquiring the image to be recognized, the image to be recognized constitutes the information to be verified according to the image to be recognized; the information to be verified is sent to the verification end, and the recognition data returned by the verification end is received; the number of recognition data returned by the verification end is monitored; if the recognition data When the number of the image to be recognized reaches the preset number threshold, the data label of the image to be recognized is determined according to the recognition data reaching the preset number threshold; the image to be recognized and the data label are composed of sample data. By intelligently generating data labels for the image to be recognized and composing sample data, a large number of data labels can be avoided, and the accuracy of sample data can also be guaranteed by intelligently forming data labels.

【技术实现步骤摘要】
样本数据获取方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,尤其涉及一种样本数据获取方法、装置、计算机设备及存储介质。
技术介绍
随着平行计算、大数据、深度学习算法、神经网络算法和人脑芯片等技术的发展,人工智能技术得到了突飞猛进的发展。越来越多的人工智能技术应用到了生活或者工作的各个领域中,帮助人们决策、代替重复性工作、减少人工劳动力和成本。示例性地,在农业领域中,也开始出现了利用神经网络模型来进行植物或者昆虫的识别,以更好地促进农业自动化技术的发展。然后,由于样本数据的缺乏以及数据标注的繁琐,都制约着人工智能技术在农业领域的应用。
技术实现思路
本专利技术实施例提供一种样本数据获取方法、装置、计算机设备及存储介质,以解决样本数据的缺乏以及数据标注繁琐的问题。一种样本数据获取方法,包括:获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;监控所述验证端返回的识别数据的数量;若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;将所述待识别图像和所述数据标签组成样本数据。一种样本数据获取装置,包括:待识别图像获取模块,用于获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;识别数据接收模块,用于将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;数量监控模块,用于监控所述验证端返回的识别数据的数量;数据标签确定模块,用于在所述识别数据的数量达到预设的数量阈值时,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;样本数据组成模块,用于将所述待识别图像和所述数据标签组成样本数据。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述样本数据获取方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述样本数据获取方法的步骤。上述样本数据获取方法、装置、计算机设备及存储介质中,在获取待识别图像之后,根据所述待识别图像组成待验证信息;将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;监控所述验证端返回的识别数据的数量;若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;将所述待识别图像和所述数据标签组成样本数据。通过智能地为待识别图像生成数据标签,并且组成样本数据,可以避免大量地数据标注工作,而且通过智能形成数据标签的方式,也保证了样本数据的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中样本数据获取方法的一应用环境示意图;图2是本专利技术一实施例中样本数据获取方法的一流程图;图3是本专利技术一实施例中样本数据获取方法的另一流程图;图4是本专利技术一实施例中样本数据获取方法的另一流程图;图5是本专利技术一实施例中样本数据获取方法的另一流程图;图6是本专利技术一实施例中样本数据获取方法的另一流程图;图7是本专利技术一实施例中样本数据获取装置的一示意图;图8是本专利技术一实施例中样本数据获取装置的另一示意图;图9是本专利技术一实施例中样本数据获取装置的另一示意图;图10是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的样本数据获取方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)与验证端通过网络与服务端进行通信。服务端获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;监控所述验证端返回的识别数据的数量;若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;将所述待识别图像和所述数据标签组成样本数据。其中,客户端(计算机设备)和验证端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种样本数据获取方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:S201:获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息。其中,待识别图像为客户端采集的带有目标物的图像。该目标物可以为植物、动物或者其他对象。具体地,该待识别图像可以为具有图像采集功能的客户端采集的图像,或者该客户端从其他渠道获取到的图像。示例性地,客户端可以为无人机,该无人机通过采集室外区域中的某一植物的图像,然后将该图像发送至服务端,服务端即获取到该待识别图像。或者,该客户端也可以为虫害捕获装置,该虫害捕获装置采集其捕获到的虫害的图像之后,将该图像发送至服务端,服务端即获取到该待识别图像。在得到待识别图像之后,根据所述待识别图像组成待验证信息。该待验证信息为引导验证端对待识别图像进行识别的信息。例如,待验证信息可以包括待识别图像和提问信息。该提问信息可以为文字信息和/语音信息。示例性的,该提问信息可以为“请问图像中是什么东西?”、“请问图像中是什么植物?”或者“请问图像中是什么动物?”等。在一个具体实施方式中,在得到待识别图像之后,可以先对待识别图像进行一个类别的判断或者识别,例如,判断待识别图像是动物还是植物。在识别除该待识别图像的类别之后,再为该待识别图像匹配对应的提问信息,最终组成待验证信息。S202:将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据。其中,验证端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。可以理解地,验证端的数量不做限定,可以将待验证信息发送到大量不同的验证端中,再接收每一验证端返回的识别数据。进一步地,可以将待验证信息通过登陆验证信息的方式发送到验证端中。验证端再其界面上显示该待验证信息,以供用户回答或者输入该识别数据。示例性地,在应用程序的注册或者登录过程中,加入该待验证信息。验证端通过收集用户在注册或者登录过程中的针对待验证信息输入的识别数据,再将识别数据发送到服务端。S203:监控所述验证端返回的识别本文档来自技高网...

【技术保护点】
1.一种样本数据获取方法,其特征在于,包括:/n获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;/n将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;/n监控所述验证端返回的识别数据的数量;/n若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;/n将所述待识别图像和所述数据标签组成样本数据。/n

【技术特征摘要】
1.一种样本数据获取方法,其特征在于,包括:
获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;
将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;
监控所述验证端返回的识别数据的数量;
若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;
将所述待识别图像和所述数据标签组成样本数据。


2.如权利要求1所述的样本数据获取方法,其特征在于,所述根据所述待识别图像组成待验证信息,包括:
对所述待识别图像进行图像分割,得到分割图像;
将每一所述分割图像输入到类别识别模型中进行识别,得到每一分割图像的类别信息;
根据每一分割图像的类别信息为每一所述分割图像匹配提问信息;
将每一分割图像和对应的提问信息组成待验证信息。


3.如权利要求1所述的样本数据获取方法,其特征在于,所述根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签,包括:
将每一识别数据进行特征向量转化,并组成识别向量集;
将预设数量的识别向量设置为初始聚类点,根据所述初始聚类点采用聚类算法对所述识别向量集进行聚类分析,得到不同的识别向量簇;
按照预设的向量距离计算每一识别向量簇的向量数量;
将所述向量数量最多的识别向量簇确定为目标向量簇;
确定所述目标向量簇的聚类中心,将与所述聚类中心距离最近的识别向量确定为目标向量;
将所述目标向量对应的识别数据确定为所述待识别图像的数据标签。


4.如权利要求1所述的样本数据获取方法,其特征在于,在所述将所述待识别图像和所述数据标签组成样本数据之后,所述样本数据获取方法还包括:
将所述待识别图像输入到预设的目标识别模型中,得到输出信息;
判断所述输出信息和所述数据标签是否一致;
若所述输出信息和所述数据标签不一致,则将所述样本数据存储到预设的样本更新库中。


5.如权利要求4所述的样本数据获取方法,其特征在于,在所述将所述样本数据存储到预设的样本更新库中之后,所述样本数据获取方法还包括:
监控所述样本更新库中的所述样本数据的数量;
若所述样本数据的数量达到预设的触发阈值,则将所述样本更新库中的所述样本数据加入到所述目标识别模型中的训练样本中;
采用所述训练样本训...

【专利技术属性】
技术研发人员:唐宇骆少明侯超钧庄家俊郭琪伟褚璇苗爱敏陈亚勇高升杰程至尚朱耀宗陈家政吴亮生
申请(专利权)人:仲恺农业工程学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1