音频模拟制造技术

技术编号:37967575 阅读:10 留言:0更新日期:2023-06-30 09:42
本发明专利技术提供了方法、计算机程序产品和系统。本发明专利技术可以基于满足请求的上下文信息动态地生成与位置相关联的一个或多个图像的音频。本发明专利技术可将生成的音频嵌入一个或多个图像中。本发明专利技术然后可以在用户设备上显示具有嵌入的音频的一个或多个图像。音频的一个或多个图像。音频的一个或多个图像。

【技术实现步骤摘要】
【国外来华专利技术】音频模拟

技术介绍

[0001]本专利技术一般地涉及音频模拟,具体地涉及使用一个或多个物联网(IoT)设备来模拟音频。
[0002]虚拟现实(VR)通常指的是可以与真实世界相似或完全不同的模拟体验。虚拟现实的应用可包括娱乐和教育目的。其他不同类型的VR类型技术包括增强现实和混合现实。使用虚拟现实设备的人能够环顾人工世界,在人工世界中四处移动,并且与虚拟特征或项目交互。效果通常由VR头戴设备产生,VR头戴设备由在眼睛前方具有小屏幕的头戴式显示器组成,但是也可通过具有多个大屏幕的专门设计的房间产生。虚拟现实通常包含听觉和视频反馈,但也可允许通过触觉技术的其他类型的感觉和力反馈。
[0003]增强现实(AR)通常指的是真实世界环境的交互体验,其中驻留在真实世界中的对象由计算机生成的感知信息(有时跨多个感知模态,包括视觉、听觉、触觉、体感和嗅觉)来增强。AR可被定义为实现三个基本特征的系统:真实世界和虚拟世界的组合、实时交互、以及虚拟和真实对象的准确3D配准。叠加的感觉信息可以是有建设性的(即,对自然环境的补充)或有破坏性的(即,对自然环境的掩蔽)。这种体验与物理世界无缝交织,使得其被感知为真实环境的沉浸式方面。以此方式,增强现实改变了人们对现实世界环境的持续感知,而虚拟现实用模拟的环境完全取代了用户的现实世界环境。
[0004]数字双胞胎是生命或非生命物理实体的数字副本。一般而言,数字双胞胎是指可用于不同目的的潜在和实际物理资产(物理双胞胎)、过程、人、地点、系统和设备的数字副本。数字表示提供物联网设备如何在其生命周期中运行和存活的元素和动态两者。
[0005]数字双胞胎具有两个主要特征:物理模型和相应的虚拟模型或对应物之间的连接,以及通过使用传感器生成实时数据来建立该连接。一般而言,数字双胞胎将IoT、人工智能、机器学习和软件分析与空间网络图集成,以创建随着它们的物理对应物改变而更新和改变的活动数字模拟模型。数字双胞胎持续地从多个源学习和更新自身以表示其近实时状态、工作状况或位置。该学习系统从其自身学习,使用传达其操作状况的各个方面的传感器数据,从人类专家(例如,具有深刻和相关行业领域知识的工程师)、从其他类似机器、从其他类似机器群、以及从较大系统和环境(其可以是其一部分)学习。数字双胞胎还将过去机器使用的历史数据整合到其数字模型中。
[0006]虚拟环绕是试图创建存在比实际存在的声音源更多的声音源的感知的音频系统。此类系统的最近实例经设计以使用一个、两个或三个扬声器来模拟真实(物理)环绕声体验。这些系统在想要在没有传统上需要这么做的大量扬声器的情况下享受环绕声的体验的消费者中很流行。
[0007]3D音频效果是操纵由立体声扬声器、环绕声扬声器、扬声器阵列或耳机产生的声音的一组声音效果。这经常涉及将声源虚拟放置在三维空间中的任何地方,包括在收听者后面、上方或下方。

技术实现思路

[0008]根据本专利技术的方面,提供了一种计算机实现的方法。该方法包括:基于满足请求的上下文信息来动态地生成与位置相关联的一个或多个图像的音频;将生成的音频嵌入到一个或多个图像中;以及在用户设备上显示具有嵌入的音频的一个或多个图像。
附图说明
[0009]现在将参考以下附图仅通过实例的方式来描述本专利技术的优选实施例,在附图中:
[0010]图1示出了根据本专利技术的实施例的计算环境的框图;
[0011]图2是示出根据本专利技术的实施例的用于创建多变量体验的操作步骤的流程图;
[0012]图3是示出根据本专利技术的实施例的用于生成和模拟音频的操作步骤的流程图;以及
[0013]图4是根据本专利技术的实施例的示例系统的框图。
具体实施方式
[0014]本专利技术的实施例认识到当前增强和虚拟现实系统的缺陷。具体地,本专利技术的实施例认识到,当前的增强和虚拟现实系统缺乏对物理位置的音频和声学进行仿真的综合方式。例如,传统的增强和虚拟现实系统通常不专注于用户传达或以其他方式描绘和经历音频的方式。照此,用户通常缺乏和不能体验在重建的位置中描绘的音频。例如,增强和虚拟现实系统可重新创建建筑物(例如,房屋的房间)的布局,然而,传统的增强和虚拟现实系统缺乏任何手段来描绘声音(例如,音频)如何在结构中回响,并且不能在一天中的不同时间点在特定条件(例如,在下雨期间)、特定事件(例如,从街道听到的噪声水平)期间准确地传达与区域相关联的典型声音。照此,本专利技术的实施例通过在经设计以向用户提供位置的真实表示的所产生的用户接口中模拟音频而提供针对增强和虚拟现实系统的缺陷的解决方案。例如,如稍后在本说明书中更详细地讨论的,本专利技术的实施例可以通过使用数字双胞胎模拟和所收集的上下文信息来模拟音频。例如,本专利技术的一些实施例可以模拟不同的噪声水平如何影响某些位置并且生成建议以改善(例如,减少)噪声水平。
[0015]如本文中所使用的上下文信息指代关于位置(例如,预期目的地)的信息。如本文所使用的,位置是指具有一个或多个结构布局的物理结构,其中每个布局包括一个或多个对象(例如,家具、装饰等)。地点的示例可包括住宅结构(例如,房屋、公寓、公寓等)以及商业结构(例如,零售分区建筑物)。上下文信息还可包括用于构建结构和结构的布局的材料(例如,使用木材对比地毯的地板、隔音材料、壁的厚度等)。
[0016]上下文信息还可包括从一个或多个物联网(IoT设备)以及与位置相关联的一个或多个公共或以其他方式许可的访问数据库收集的音频数据。音频数据的示例可包括一个或多个音频文件(例如,预录制的声音,诸如可针对特定布局或位置来重建和播放的存储的音频文件库)。
[0017]上下文信息还可包括天气数据(例如,太阳/雨/雪、湿度、云指数、UV指数、风、露点、气压、可见度等)、亮度(例如,太阳的位置)、时间、GPS位置、位置中的用户数量。上下文信息还可包括关于位置处或位置附近的对象的信息(例如,某些街道标志、灯、广告牌、长凳等的地理标签)。在该实施例中,天气数据可以与一个或多个音频文件相关,以模拟在特定
位置经历的天气。
[0018]上下文信息还可包括关于位置的信息(例如,位置信息)。例如,位置信息可以包括建筑物的运行时间、道路关闭、基于排定的事件(如音乐会)的预期交通、实时交通、位置的队列状态(如餐厅等待时间)、用户偏好等。
[0019]本专利技术的实施例可以利用具有来自经由众源的(crowdsourced)数据的用户的许可的上下文信息。例如,本专利技术的实施例可以为用户提供允许本专利技术的实施例收集和使用由用户提供的信息(例如,用户生成的音频、用户上传的图像、用户生成的标签、用户版权图像等)的选择加入/选择退出机制。本专利技术的一些实施例可以在每次收集信息或以其他方式使用信息时向用户发送通知。
[0020]图1是示出根据本专利技术的实施例的计算环境(一般指定为计算环境100)的功能框图。图1仅提供一个实现方式的图示并且不暗示关于其中可以实现不同实施例的环境的任何限制。本领域技术人员可对所描述的环境作出许多修改,而不脱离权利要求书所述的本专利技术的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现方法,包括:基于满足请求的上下文信息动态地生成与位置相关联的一个或多个图像的音频;将生成的音频嵌入所述一个或多个图像中;以及在用户设备上显示具有嵌入的音频的所述一个或多个图像。2.根据权利要求1所述的计算机实现的方法,进一步包括:可选地细化所述一个或多个图像。3.根据权利要求1所述的计算机实现的方法,其中,基于满足请求的上下文信息动态地生成用于与位置相关联的一个或多个图像的音频包括:对与所述位置相关联的上下文信息进行优先级排序;生成与所述上下文信息匹配的一个或多个图像;以及生成与匹配所述上下文信息的一个或多个生成的图像相关联的音频。4.根据权利要求3所述的计算机实现的方法,进一步包括:基于上下文信息改变多个识别的对象中的至少一个对象。5.根据权利要求4所述的计算机实现的方法,进一步包括:基于所述多个识别的对象中的每一个识别的对象的声学特性来索引所述多个识别的对象。6.根据权利要求4所述的计算机实现的方法,进一步包括:生成要覆盖在所述一个或多个生成的图像上的一个或多个图形图标,所述图形图标表示所述多个对象中的至少一个对象;将至少一个或多个生成的图形图标覆盖在显示在所述用户设备上的所述一个或多个生成的图像中的生成的图像上;以及响应于选择生成的一个或多个图形图标中的至少一个生成的图形图标,播放与所述多个对象中的相应对象相关联的音频。7.根据权利要求1所述的计算机实现的方法,进一步包括:生成表示与在所述一个或多个图像的相应图像中描述的对象相关联的噪声水平的分数;以及响应于生成的分数满足或超过噪声水平的阈值分数,推荐改变所述对象的声学特性的动作。8.一种计算机程序产品,包括:一个或多个计算机可读存储介质和存储在所述一个或多个计算机可读存储介质上的程序指令,所述程序指令包括:用于基于满足请求的上下文信息动态地生成与位置相关联的一个或多个图像的音频的程序指令;用于将生成的音频嵌入到所述一个或多个图像中的程序指令;以及用于在用户设备上显示具有嵌入的音频的所述一个或多个图像的程序指令。9.根据权利要求8所述的计算机程序产品,其中,存储在所述一个或多个计算机可读存储介质上的所述程序指令进一步包括:用于可选地细化所述一个或多个图像的程序指令。10.根据权利要求8所述的计算机程序产品,其中,基于满足请求的上下文信息动态地
生成用于与位置相关联的一个或多个图像的音频的所述程序指令包括:用于对与位置相关联的上下文信息进行优先级排序的程序指令;用于生成与所述上下文信息匹配的一个或多个图像的程序指令;以及用于生成与匹配所述上下文信息的一个或多个生成的图像相关联的音频的程序指令。11.根据权利要求10所述的计算机程序产品,其中,存储在所述一个或多个计算机可读存储介质上的所述程序指令进一步包括:用于基于上下文信息改变多个识别的对象中的至少一个对象的程序指令。12.根据权利要求11所述的计算机程序产品,其中,存储在所述一个或多个计算机可读存储介质上的所述程序指令进一步包括:用于基于所述多个识别的对象中的每个识别的对象的声学特性索引所...

【专利技术属性】
技术研发人员:S
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1