本发明专利技术公开了音频记录的地理标记。本发明专利技术涉及一种地理标记音频记录的方法。该方法包括:确定该音频记录被录制的地点(220);获得含有该地点的指示的图像或含有这样的图像的文件的参考(230);以及创建(215,240)单一文件(1),该单一文件(1)含有:音频记录(4);和图像(8)或含有该图像的独立文件的参考。该地点的指示包括以下至少一种:包括该地点的地图(8a);包括该地点的航摄照片或卫星照片;以及叠加在该图像上以指明该地点的文本(8b)。
【技术实现步骤摘要】
本专利技术涉及用关于制作音频记录的一个或多个地点的信息注解音频记录。本专利技术尤其涉及允许将音频数据和图像数据一起存储在单一文件中的文件格式。
技术介绍
存在多种数字音频格式。最流行和广泛采用的一种格式基于MPEG-I或MPEG-2音频层3标准。通常用与该格式相关的文件扩展名“MP3”来提及该格式。其他音频文件格式包括其他的国际标准,例如,高级音频编码(AAC);专属标准,例如视窗媒体音频(WMA);和自由可用编解码,例如自由无损音频编解码(FLAC )。已知在音频文件中提供元数据以便描述音频内容。音频文件通常用于音乐,以及很多与音频文件格式关联的元数据受该用途的影响。例如,通常提供用于例如艺术家名字、曲目编号(Track Number),曲目名称和专辑名称的信息的元数据元素(字段或“标签”)。 “ID3v2”为用于通常与MP3格式和一些其他音频文件格式一起使用的元数据容器的非正式的标准。和MP3本身一样,ID3v2已经被广泛采用。其他音频文件类型可以使用不同的元数据格式。例如,高级系统格式(ASF)可以用作用于WMA文件和相关元数据的容器。然而,传统的元数据规范(例如ID3v2和其他)几乎未对与用于音乐记录的元数据描述不同的元数据描述提供支持。具体而言,很少提供或尚未提供对制作声音记录的地点的描述。
技术实现思路
根据本专利技术的一方面,提供了一种地理标记音频记录的方法,其包括确定录制音频记录的地点;获得含有所述地点的指示的图像或含有这样的图像的文件的参考;以及创建单一文件,该单一文件含有所述音频记录;以及所述图像或含有所述图像的独立文件的参考,其中,所述地点的指示包括以下至少一种包括所述地点的地图;包括所述地点的航摄照片或卫星照片;以及叠加在所述图像上以指明所述地点的文本。含有所述图像的文件的参考可以为地址,可以从该地址检索到所述图像,所述地址例如为图像的URL。获得所述图像可包括产生所述图像。可替选地,可以与本方法不相关地产生所述图像,或者可以通过执行本方法的装置获得所述图像(或图像的参考)。也就是说,产生所述图像的装置和创建所述单一文件的装置可以为相同的装置或不同的装置。如果在录制音频的同时执行该方法,则确定地点的步骤可包括使用例如全球定位系统(GPS)接收器的定位系统以建立地点。可替选地,如果该方法在以后(在音频已经被录制之后)执行,则确定地点的步骤可包括读取之前建立的地点。例如,所述地点可以提供在含有音频或与音频关联的文件的元数据中。包括所述地点的航摄照片优选为竖直的航摄照片,也就是说,由大约竖直向下指向的摄像机对所述地点拍摄的俯视照片图像。对于该地点的卫星照片也是如此。这些高空照片表示与地图共享如下特征通过参考该图像,可以在二维上(在地球的表面上)唯一地识别点。通过参考地图或航摄照片/卫星照片,还可以在录制地点的区域中导航。地图可以定义为地理特征的象征图形表示(与照片表示相对)。还可以组合地图和照片表示(例如通过将比如公路的符号叠加在航摄照片上)。因此单一图像可以包括照片和地图。优选地,地图或照片包含在地图或照片上识别地点的位置的标记。通常用户能够立即理解在区域的俯视图上的标记(或符号)为录制地点的指示。如果用户试图找到通向该地点的路,则该标记作为辅助也是特别有用的。优选地,该图像被嵌入在文件内。这避免了图像文件和音频记录分离或图像文件 的链接失效的潜在问题。根据优选实施方式,提供了一种利用音频记录被录制的地点来地理标记音频记录的方法,该方法包括产生含有所述地点的指示的图像;以及创建含有所述音频记录和所述图像的单一文件,其中所述地点的指示包括所述地点的地图和/或叠加在所述图像上以指明所述地点的文本。存储音频被录制的地点在很多应用中是有用的,尽管对于音乐曲目而言可能不是明显有用的。例如,在很多应用中期望用捕获地点来注解语音备忘录或口述笔记。其他类型的特定地点音频可包括用于科学目的、保存目的或休闲目的的野外生命的声音记录(例如鸟鸣声)。可以开发专用或特定形式的元数据以适应描述地点的需求。然而,这样的元数据将违背已经广泛采用的规范和标准,从而导致与现有装置和软件的不兼容性。最希望的是这些现有的工具(不能被编程以理解特定的地点元数据)可简单地忽略该不兼容性。例如,如果元数据嵌入在为“评论”预留的文本字段中,则这种情况可能发生。然而,这仍然存在问题,因为使用现有工具访问地点元数据是困难的并且是非直观的。本专利技术通过将地点元数据嵌入在图片中来避免这些问题。本专利技术人已经认识到,因为音频文件格式传统上已用来存储音乐,故通常支持将一个或多个旨在含有专辑封面的图像嵌入到音频文件中。可替选地,一个或多个这样的图像的链接可以被嵌入到音频文件中。在每种情况下,可以开发这些元数据要素来提供地理标记音频文件的问题的解决方案(地理标记意味着将识别地理地点的元数据添加到数字媒体项目)。本解决方案非常适合以下方式嵌入的图像元数据和链接的图像由处理音频文件的装置和软件常规处理。例如,通常是当一装置在播放音乐曲目时,要在显示屏上显示专辑封面的图像。同样,例如为计算机操作系统的软件可以使用该图像作为图标以在文件系统中表示该文件。在这两种情况下,本专利技术具有以下效果录制的地点可视地指示给用户(在音乐曲目的封面处)。因此,本专利技术以与现有标准、硬件和软件向后相容的方式提供地点的方便和直观的表示。此外,完全不需要额外努力。在很多情况下,另外保留为空或未使用的元数据字段被利用。这是因为,对于很多类型的音频记录,没有专辑封面是可用的或相关的。叠加的文本可包括以文本形式的位置坐标和/或反向地理编码的地址(反向地理编码为将位置坐标转化成人可读的地址或地名的过程)。该文本可以叠加在平面背景上;叠加在照片上;或如果图像包括地点的地图,则叠加在该地图上。因此,在本文中,“叠加”文本指在图像中呈现文本字符,使得当观看图像时,文本字符为可见的。该图像可以为镶嵌面,包括含叠加有文本的均匀或平面背景的第一部分和独立的地图部分。这避免了文本叠加挡住地图的可视特征。还可通过确保文本和背景之间有良好的对比度来改善文本的可读性。优选地,根据数字音频文件格式来格式化所述单一文件。一组合适的音频文件格式是允许将图像作为元数据的一部分嵌入的文件格式。这些文件格式可包括但不限于MP3、AAC、WMA (至少当包含在ASF文件中时)、音频交换文件格 式(AIFF)、MPEG-4音频(M4A)和MPEG-4音频书文件(M4B)。另一组音频文件格式包括允许将这样的图像的链接(参考)嵌入的文件格式。一些文件格式可既支持直接嵌入图像又支持嵌入图像的链接。例如,已经提出将名称为元数据-块-图片(METADATA_BLOCK_PICTURE)的字段添加到VorbisComment元数据格式,该元数据格式旨在与Ogg容器格式的Vorbis编解码器一起使用。根据用户偏好,所提出的字段允许图像被链接或嵌入。该图像可以嵌入在音频文件格式的为元数据预留的部分中。具体而言,图像可以嵌入在为例如前封面或后封面的专辑封面预留的元数据的部分中。适合类型的元数据可包括ID3v2标签和Vorbis评论等。文件可以为MP3文件,并且根据ID3v2规范,图像被嵌入在“附加图片”(APIC)帧中。ID3v2规范将AP本文档来自技高网...
【技术保护点】
一种对音频记录进行地理标记的方法,所述方法包括:确定所述音频记录被录制的地点(220);获得含有所述地点的指示的图像或含有这样的图像的文件的参考(230);以及创建(215,240)单一文件(1),所述单一文件(1)含有:所述音频记录(4);和所述图像(8)或含有所述图像的独立文件的参考,其中所述地点的所述指示包括以下至少一种:包括所述地点的地图(8a);包括所述地点的航摄照片或卫星照片;叠加在所述图像上以指明所述地点的文本(8b)。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:霍华德·奥利弗·希克曼,
申请(专利权)人:瑞士优北罗股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。