The invention discloses a sample data acquisition method, device, computer equipment and storage medium. After acquiring the image to be recognized, the image to be recognized constitutes the information to be verified according to the image to be recognized; the information to be verified is sent to the verification end, and the recognition data returned by the verification end is received; the number of recognition data returned by the verification end is monitored; if the recognition data When the number of the image to be recognized reaches the preset number threshold, the data label of the image to be recognized is determined according to the recognition data reaching the preset number threshold; the image to be recognized and the data label are composed of sample data. By intelligently generating data labels for the image to be recognized and composing sample data, a large number of data labels can be avoided, and the accuracy of sample data can also be guaranteed by intelligently forming data labels.
【技术实现步骤摘要】
样本数据获取方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,尤其涉及一种样本数据获取方法、装置、计算机设备及存储介质。
技术介绍
随着平行计算、大数据、深度学习算法、神经网络算法和人脑芯片等技术的发展,人工智能技术得到了突飞猛进的发展。越来越多的人工智能技术应用到了生活或者工作的各个领域中,帮助人们决策、代替重复性工作、减少人工劳动力和成本。示例性地,在农业领域中,也开始出现了利用神经网络模型来进行植物或者昆虫的识别,以更好地促进农业自动化技术的发展。然后,由于样本数据的缺乏以及数据标注的繁琐,都制约着人工智能技术在农业领域的应用。
技术实现思路
本专利技术实施例提供一种样本数据获取方法、装置、计算机设备及存储介质,以解决样本数据的缺乏以及数据标注繁琐的问题。一种样本数据获取方法,包括:获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;监控所述验证端返回的识别数据的数量;若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;将所述待识别图像和所述数据标签组成样本数据。一种样本数据获取装置,包括:待识别图像获取模块,用于获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;识别数据接收模块,用于将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;数量监控模块,用于 ...
【技术保护点】
1.一种样本数据获取方法,其特征在于,包括:/n获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;/n将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;/n监控所述验证端返回的识别数据的数量;/n若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;/n将所述待识别图像和所述数据标签组成样本数据。/n
【技术特征摘要】
1.一种样本数据获取方法,其特征在于,包括:
获取客户端发送的待识别图像,根据所述待识别图像组成待验证信息;
将所述待验证信息发送到验证端中,并接收所述验证端返回的识别数据;
监控所述验证端返回的识别数据的数量;
若所述识别数据的数量达到预设的数量阈值,则根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签;
将所述待识别图像和所述数据标签组成样本数据。
2.如权利要求1所述的样本数据获取方法,其特征在于,所述根据所述待识别图像组成待验证信息,包括:
对所述待识别图像进行图像分割,得到分割图像;
将每一所述分割图像输入到类别识别模型中进行识别,得到每一分割图像的类别信息;
根据每一分割图像的类别信息为每一所述分割图像匹配提问信息;
将每一分割图像和对应的提问信息组成待验证信息。
3.如权利要求1所述的样本数据获取方法,其特征在于,所述根据达到预设的数量阈值的识别数据确定所述待识别图像的数据标签,包括:
将每一识别数据进行特征向量转化,并组成识别向量集;
将预设数量的识别向量设置为初始聚类点,根据所述初始聚类点采用聚类算法对所述识别向量集进行聚类分析,得到不同的识别向量簇;
按照预设的向量距离计算每一识别向量簇的向量数量;
将所述向量数量最多的识别向量簇确定为目标向量簇;
确定所述目标向量簇的聚类中心,将与所述聚类中心距离最近的识别向量确定为目标向量;
将所述目标向量对应的识别数据确定为所述待识别图像的数据标签。
4.如权利要求1所述的样本数据获取方法,其特征在于,在所述将所述待识别图像和所述数据标签组成样本数据之后,所述样本数据获取方法还包括:
将所述待识别图像输入到预设的目标识别模型中,得到输出信息;
判断所述输出信息和所述数据标签是否一致;
若所述输出信息和所述数据标签不一致,则将所述样本数据存储到预设的样本更新库中。
5.如权利要求4所述的样本数据获取方法,其特征在于,在所述将所述样本数据存储到预设的样本更新库中之后,所述样本数据获取方法还包括:
监控所述样本更新库中的所述样本数据的数量;
若所述样本数据的数量达到预设的触发阈值,则将所述样本更新库中的所述样本数据加入到所述目标识别模型中的训练样本中;
采用所述训练样本训...
【专利技术属性】
技术研发人员:唐宇,骆少明,侯超钧,庄家俊,郭琪伟,褚璇,苗爱敏,陈亚勇,高升杰,程至尚,朱耀宗,陈家政,吴亮生,
申请(专利权)人:仲恺农业工程学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。