基于展品图像识别的语音讲解数据处理方法及装置制造方法及图纸

技术编号:19009182 阅读:24 留言:0更新日期:2018-09-22 09:03
本申请公开了一种基于展品图像识别的语音讲解数据处理方法及装置,其中方法包括:获取景点区域的展品图像;对所述展品图像进行分类,得到与所述展品图像对应的类别;根据所述类别对应的特征模型提取图像特征;查询景点图像数据库,获取与所述图像特征对应的展品对象,得到展品对象列表;根据所述展品对象列表获取用户选择的展品对象;调取所述用户选择的展品对象对应的描述信息并进行语音播放。本申请采用图像识别的方式,通过所述景点图像数据库的智能学习,达到完善所述景点图像数据库的目的,以便提高对景点区域内展品图像进行识别的精确度,为语音讲解起到辅助作用,最终解决了通过图像识别实现智能语音导游的目的。

Speech interpretation data processing method and device based on exhibits image recognition

The present application discloses a speech interpretation data processing method and device based on exhibit image recognition, wherein the method includes: acquiring exhibit image of scenic spot area; classifying the exhibit image to obtain the category corresponding to the exhibit image; extracting image features according to the feature model corresponding to the category; The attraction image database obtains the exhibition objects corresponding to the image features, obtains the exhibition objects list, obtains the exhibition objects selected by the user according to the exhibition objects list, and calls the description information corresponding to the exhibition objects selected by the user and performs voice playback. The application adopts the method of image recognition, through the intelligent learning of the image database of the scenic spots, achieves the purpose of perfecting the image database of the scenic spots, so as to improve the accuracy of recognizing the images of exhibits in the scenic spots area, plays an auxiliary role in the speech explanation, and finally solves the problem of realizing intelligent speech through image recognition. The purpose of the tour guide.

【技术实现步骤摘要】
基于展品图像识别的语音讲解数据处理方法及装置
本申请涉及图像识别
,具体而言,涉及一种基于展品图像识别的语音讲解数据处理方法及装置。
技术介绍
随着旅游行业的发展,为了详细了解各个景点,游客一般是通过专业的导游进行介绍来了解的。因专业导游的费用较高,因此直接提高了游客旅游的费用。为了解决这种问题,手机语音导游行业随着产生。手机语音导游系统目前主要应用在风景名胜区,内容包括景区内各种游览线路、沿途各景点的语音介绍,景区内各种服务设施所处的位置及文字介绍。游客可以在进入景区开始,选择感兴趣的游览线路,沿途可以随时通过手机定位,通过地图找到自己所处的景点位置,聆听所处的景点介绍。然而这种方式对室内游览并不适应,如博物馆(尤其是国外博物馆)等场所。因为是室内定位对定位手机定位对室内区域的定位的精确度有很高要求,因此在手机信号弱的区域、信号盲区或室内(如室内博物馆)等区域并不能精确地确定当前位置,进而直接影响了游客对当前景点的了解。
技术实现思路
本申请的主要目的在于提供一种基于展品图像识别的语音讲解数据处理方法,以解决针对室内的景点区域内展品进行识别,提高图像识别效率及识别准确率,最终解决智能语音导游精确度低的技术问题。为了实现上述目的,根据本申请的一个方面,提供了一种基于展品图像识别的语音讲解数据处理方法。根据本申请的基于展品图像识别的语音讲解数据处理方法包括:获取景点区域的展品图像;对所述展品图像进行分类,得到与所述展品图像对应的类别;根据所述类别对应的特征模型提取图像特征;查询景点图像数据库,获取与所述图像特征对应的展品对象,得到展品对象列表,所述景点图像数据库存储有展品对象和图像特征、描述信息的关联关系;根据所述展品对象列表获取用户选择的展品对象;调取所述用户选择的展品对象对应的描述信息并进行语音播放。进一步,所述对所述展品图像进行分类,包括:获取所述展品图像中展品区域;判断所述展品区域是否为矩形;如果为矩形,则确定所述展品图像为第一类别,否则为第二类别,其中,所述第一类别为具有相框的展品,所述第二类别为不具有相框的展品。进一步,所述方法还包括:在对所述展品图像进行分类前,判断所述展品图像是否为通过扫描方式得到;如果所述展品图像是通过扫描方式得到,则判断所述展品图像中展品是否落入图像采集区域的预设框内;如果所述展品图像未落入所述预设框内,则重新扫描。进一步,所述方法还包括:如果所述展品图像是通过非扫描方式得到,则按照预设类别将所述展品图像进行分类。进一步,所述方法还包括:在获取景点区域展品图像前,确定所述景点区域的位置。进一步,所述确定用户的当前位置,包括:利用GPS定位技术获取用户的当前位置;和/或获取用户根据预设区域选择的当前景点所处的位置。进一步,所述方法还包括:在查询景点图像数据库前,根据所述景点数据库中的展品对象及其馆藏地点确定目标展品对象;获取所述目标展品对象的展品图像;将所述目标展品对象的展品图像与所述目标展品对象的展品图像进行匹配,判断是否一致;如果不一致,则将所述目标展品对象的展品图像存储至所述景点数据库。为了实现上述目的,根据本申请的另一方面,提供了一种基于展品图像识别的语音讲解数据处理装置。根据本申请的基于展品图像识别的语音讲解数据处理装置包括:图像获取单元,用于获取景点区域展品图像;图像分类单元,用于对所述展品图像进行分类,得到所述展品图像对应的类别;特征提取单元,用于根据所述类别对应的特征模型提取图像特征;具体地,所述特征提取单元设置不同的特征模型提取模块,以便提取不同类别的图像特征。具体地,所述特征模块可以是基于深度学习的模型,如CNN模型。结果筛选单元,用于查询景点图像数据库,获取与所述图像特征对应的展品对象,得到展品对象列表,所述景点图像数据库存储有展品对象和图像特征、描述信息的关联关系;对象选择单元,用于根据所述展品对象列表获取用户选择的展品对象;语音播报单元,用于调取所述用户选择的展品对象对应的描述信息并进行语音播放。进一步,所述图像分类单元包括:区域获取模块,用于获取所述展品图像中展品区域;矩形判断模块,用于判断所述展品区域是否为矩形;类别划分模块,用于如果为矩形,则确定所述展品图像为第一类别,否则为第二类别,其中,所述第一类别为具有相框的展品,所述第二类别为不具有相框的展品。进一步,所述装置还包括:扫描判断单元,用于在获取景点区域展品图像前,判断所述展品图像是否为通过扫描方式得到;第一处理单元,用于如果所述展品图像是通过扫描方式得到,则判断所述展品图像中展品是否落入图像采集区域的预设框内;再扫描处理单元,用于如果所述展品图像未落入所述预设框内,则重新扫描。进一步,所述装置还包括:第二处理单元,用于如果所述展品图像是通过非扫描方式得到,则按照预设类别将所述展品图像进行分类。进一步,所述装置还包括:景点定位单元,用于在获取景点区域展品图像前,确定所述景点区域的位置。进一步,所述景点定位单元包括:GPS定位模块,用于利用GPS定位技术获取用户的当前位置;和/或自定义定位模块,用于获取用户根据预设区域选择的当前景点所处的位置。进一步,所述装置还包括:目标确定单元,用于在查询景点图像数据库前,根据所述景点数据库中的展品对象及其馆藏地点确定目标展品对象;图像再获取单元,用于获取所述目标展品对象的展品图像;更新判断单元,用于将所述目标展品对象的展品图像与所述目标展品对象的展品图像进行匹配,判断是否一致;更新处理单元,用于如果不一致,则将所述目标展品对象的展品图像存储至所述景点数据库。在本申请实施例中,采用图像识别的方式,通过所述景点图像数据库的智能学习,以达到完善所述景点图像数据库的目的,以便提高对景点区域内展品图像进行识别的精确度,为语音讲解起到辅助作用,最终解决了通过图像识别实现智能语音导游的目的。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请所述基于展品图像识别的语音讲解数据处理方法的流程示意图;图2为本申请对所述展品图像进行分类一个实施例的流程示意图;图3为本申请对所述展品图像进行分类另一个实施例的流程示意图;图4为本申请所述景点图像数据库一个实施例的工作流程示意图;图5为本申请所述基于展品图像识别的语音讲解数据处理装置的框图结构示意图;以及图6为应用本申请所述基于展品图像识别的语音讲解数据处理装置的一个实施例的架构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图本文档来自技高网
...
基于展品图像识别的语音讲解数据处理方法及装置

【技术保护点】
1.一种基于展品图像识别的语音讲解数据处理方法,其特征在于,包括:获取景点区域的展品图像;对所述展品图像进行分类,得到与所述展品图像对应的类别;根据所述类别对应的特征模型提取图像特征;查询景点图像数据库,获取与所述图像特征对应的展品对象,得到展品对象列表,所述景点图像数据库存储有展品对象和图像特征、描述信息的关联关系;根据所述展品对象列表获取用户选择的展品对象;调取所述用户选择的展品对象对应的描述信息并进行语音播放。

【技术特征摘要】
1.一种基于展品图像识别的语音讲解数据处理方法,其特征在于,包括:获取景点区域的展品图像;对所述展品图像进行分类,得到与所述展品图像对应的类别;根据所述类别对应的特征模型提取图像特征;查询景点图像数据库,获取与所述图像特征对应的展品对象,得到展品对象列表,所述景点图像数据库存储有展品对象和图像特征、描述信息的关联关系;根据所述展品对象列表获取用户选择的展品对象;调取所述用户选择的展品对象对应的描述信息并进行语音播放。2.根据权利要求1所述的方法,其特征在于,所述对所述展品图像进行分类,包括:获取所述展品图像中展品区域;判断所述展品区域是否为矩形;如果为矩形,则确定所述展品图像为第一类别,否则为第二类别,其中,所述第一类别为具有相框的展品,所述第二类别为不具有相框的展品。3.根据权利要求2所述的方法,其特征在于,所述方法包括:在对所述展品图像进行分类前,判断所述展品图像是否为通过扫描方式得到;如果所述展品图像是通过扫描方式得到,则判断所述展品图像中展品是否落入图像采集区域的预设框内;如果所述展品图像未落入所述预设框内,则重新扫描。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:如果所述展品图像是通过非扫描方式得到,则按照预设类别将所述展品图像进行分类。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取景点区域展品图像前,确定所述景点区域的位置。6.根据权利要求5所述的方法,其特征在于,所述确定用户的当前位置,包括:利用GPS定位技术获取用户的当前位置;和/或获取用户根据预设区域选择的当前景点所处的位置。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:在...

【专利技术属性】
技术研发人员:卢振业
申请(专利权)人:美景听听北京科技有限公司
类型:发明
国别省市:北京,11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1