一种照相机中照片信息获取与记录方法技术

技术编号:6978314 阅读:321 留言:0更新日期:2012-04-11 18:40
一种照相机中照片信息获取与记录方法:(1)成像模块采集图像,并提取拍照参数;(2)对图像进行压缩生成图像的原始数据;(3)图像处理模块提取视觉特征,形成图像的底层特征;(4)GPS模块提取地理坐标及景观信息,人脸识别模块检测人脸及情感,图像标注模块标注相关描述及作者,录音模块录制用户对图像的语音描述,生成语义信息。(5)原始数据、基本属性、底层特征以及语义特征信息最终形成图像的四面体表达。本发明专利技术针对图像的主要获取方式拍照,集成于相机拍摄流程中,对图像进行统一数据处理,解决相机拍摄过程中图像四面体数据的获取以及图像四面体的形成,以便于后期图像数据的处理。

【技术实现步骤摘要】

本专利技术涉及一种在图像标注及描述范畴下,照相机中照片信息获取与记录方法
技术介绍
随着信息时代的到来,信息每天都在以惊人的速度增长,Web网页、文本、图形图像、音频视频和空间数据等非结构化数据越来越多。据Gartner Group统计,当今80%的数据是非结构化数据,这些数据来源丰富、内容复杂、结构迥异,传统的关系型数据库对这些复杂类型的非结构化数据已力不从心。因此建立非结构化数据管理系统,实现非结构化数据的有效管理将具有重大意义。由于非结构化数据本身差异巨大、底层特征完全不同,如何抽象、表示数据对象是非结构化数据管理首要解决的问题。对于非结构化数据可以由四面体的4个刻面基本属性(所有数据都具有的一般属性,包括名称、类型、创建者等),语义特征(以文字表达的非结构化数据特有的语义属性,包括作者创作意图、数据主题说明、底层特征含义等语义要素),底层特征(通过各种专用处理技术(如图像、语音、视频等)获得的非结构化数据特性,如颜色、纹理、形状等),原始数据(非结构化数据的原生态文件),以及刻面间语义关联进行描述。因此,四面体数据模型能够统一描述多种非结构化数据类型,合理表达了非结构化数据的组成部分以及各组成部分之间的内在联系。同时四面体数据模型能够集成处理各种数据类型的成熟技术,有效支持非结构化数据间的特征关联,具有可扩展性。图像作为一类重要的非结构化数据,可以由四面体进行完全描述。如果能够在图像获取的同时即可提取图像的四面体信息,将极大得方便这些数据的管理。因此本专利针对图像的主要获取方式拍照,集成于相机拍摄流程中,对图像进行统一、一致地数据处理, 解决相机拍摄过程中,图像四面体数据的获取以及图像四面体的信息记录,以便于后期图像数据的管理。
技术实现思路
本专利技术的技术解决问题针对图像的主要获取方式拍照,集成于相机拍摄流程中,对图像进行统一、一致地数据处理,解决相机拍摄过程中,图像四面体数据的获取以及图像四面体的形成,以便于后期图像数据的管理。本专利技术的技术解决方案照相机中照片信息获取与记录方法,其特征在于步骤如下(1)成像模块采集图像,并提取拍照参数信息生成基本属性;(2)对图像进行压缩生成图像的原始数据;(3)图像处理模块提取视觉特征,形成图像的底层特征;(4)生成语义信息提取场景模式,GPS模块提取地理坐标及景观信息,人脸识别模块检测人脸及情感,图像标注模块标注相关描述及作者,录音模块录制用户对图像的语音描述;(5)原始数据、基本属性、底层特征以及语义信息最终形成图像的四面体表达并按 JPG格式存储。根据本专利技术的又一个方面,其中步骤(4)又进一步包括(4. 1)人脸识别模块获取采集到的图像数据,进行人脸识别;(4. 2)人脸识别后得到关于人脸位置、数目及情感信息;人脸位置是通过人脸检测识别模块得到人脸的坐标;情感信息是通过人脸检测识别模块得到的情感分类,情感分类包括笑脸、哭脸、怒脸;(4. 3) GPS模块获取当前拍摄的地理语义信息;(4. 4)标注模块能读取、编辑并保存存储图像语义信息;作者及相关描述通过在相机中嵌入标注软件,以触摸方式进行文字输入,完成对拍摄图像的相关描述;(4. 5)录音模块录制用户对图像的语音描述,并写入存储,语音描述通过录音模块,录制用户对图像语义的语音描述,用于后期处理中提取相关文字内容,丰富并完善语义 fn息ο根据本专利技术的又一个方面,其中步骤( 又进一步包括(5. 1)基本属性、底层特征以及语义信息以一定方式存放到压缩图片的头文件,以 JPG为例,以Exif存放相关信息放置在JPG文件的头部。目前Exif2. 1已支持除语义信息外其他属性以及语义信息中的作者、图像描述、GPS以及语音描述。因此仅需扩展Exif2. 1 标准支持其他语义信息的记录。(5. 1. 1)原始数据原始成像数据或者压缩数据,存放到JPG格式中压缩数据部分;(5. 1. 2)语义信息作者、场景模式(如夜景、风景、人像等)、人脸位置及情感、地理位置、人工标注的相关描述信息以及录制的用户的语言描述信息;a)!^aceExist 存在人脸的数目;Tag = 307Type = SHORT or LONGCount = 1Default = 0b)FacePosistion 每个人脸的位置;Tag = 308Type = SHORT or LONGCount = AnyDefault = nonecWacekn :笑脸、哭脸、怒脸;Tag = 309Type = SHORTCount = 1Default = 11 = Smile2 = Weep3 = Angryd) SceneMode 用户选择的照相模式(夜景、风景、人像等);Tag = 310Type = SHORTCount = 1Default = 11 = Auto2 = Portrait mode3 = Landscape mode4 = Macro mode5 = Sport mode6 = Night modee) Location 通过相机附加的GPS模块得到地理坐标及地理景观信息(目前已支持);Tag = 34853 (8825. H)Type = LONGCount = 1Default = nonef) ImageDesription 相机中嵌入标注软件完成对拍摄图像的相关描述,如“拍摄颐和园的风景照”等。Tag = 270 (10E. H)Type = ASCIICount = AnyDefault = noneg)Artist 作者,例如“Camera owner, John Smith ;Photographer, Michael Brown;Image creator, Ken James"Tag = 315(13Bh)Type = ASCIICount = AnyDefault = noneh)Audio 语音描述,例如用户对于图像语义的描述录音(目前已支持)Tag = 40964 (A004. H)Type = ASCIICount = 13Default = none(5. 1. 3)基本属性文件格式、数据大小、拍摄时间、拍摄参数(相机型号、分辨率、 光圈、快门、焦距等);按Exif已有定义存放。(5. 1. 4)底层特征图像处理模块提取的图像相关的视觉特征,如颜色、纹理等。相应的语义信息项记录格式如下a)Lowlevel feature 底层特征,例如常用的底层特征颜色直方图等Tag = 311Type = LONGCount = AnyDefault = none本专利技术集成在图像的主要获取工具相机中,在图像拍摄产生时即可提取并保存图像的四面体信息,可以作为大规模图像数据标注及特征提取的有效解决方案,支持后期图像数据的有效管理。附图说明图1为本专利技术方法基本流程图;图2为本专利技术方法照片四面体信息及提取模块图。具体实施例方式下面参考附图,对本专利技术的实施例进行详细的说明。首先对本专利技术的算法原理进行说明。图像作为一类重要的非结构化数据,可以由四面体的4个刻面基本属性(所有数据都具有的一般属性,包括名称、类型、创建者等),语义特征(以文字表达的非结构化数据特有的语义属性,包括作者创作意图、数据主题说明、底层特征含义等语本文档来自技高网
...

【技术保护点】
1.一种照相机中照片信息获取与记录方法,其特征在于步骤如下:(1)成像模块采集图像,并提取拍照参数信息生成基本属性;(2)对图像进行压缩生成图像的原始数据;(3)图像处理模块提取视觉特征,形成图像的底层特征;(4)生成语义信息:提取场景模式,GPS模块提取地理坐标及景观信息,人脸识别模块检测人脸及情感,图像标注模块标注相关描述及作者,录音模块录制用户对图像的语音描述;(5)原始数据、基本属性、底层特征以及语义信息最终形成图像的四面体表达并按JPG格式存储。

【技术特征摘要】

【专利技术属性】
技术研发人员:李未郎波刘祥龙
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1