基于声音生成AR内容的方法、存储介质和装置制造方法及图纸

技术编号：19861448 阅读：17 留言：0更新日期：2018-12-22 12:36

本发明专利技术提供一种基于声音生成AR内容的方法、存储介质和装置，该方法包括：步骤11：获取当前AR环境中的实时语音数据；步骤131：判断实时语音数据是否包含说话人，如果是，则将实时语音数据中说话人的说话内容转换为文字并提取关键语义信息；步骤132：提取实时语音数据中的人为非说话声音或自然界声音；步骤133：定位说话人、人为非说话声音或自然界声音的声源位置；步骤15：根据关键语义信息、人为非说话声音或自然界声音匹配场景；步骤17：根据关键语义信息、声源位置、场景或AR环境中的真实场景图像等生成AR内容并显示。基于本发明专利技术的方法，可以基于输入语音动态生成AR内容，实现听觉信息的AR智能展示，为用户提供更加便利、智能的服务和体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于声音生成AR内容的方法、存储介质和装置
本专利技术涉及计算机领域，特别涉及一种基于声音生成AR内容的方法、存储介质和装置。
技术介绍
典型的增强现实技术AR(AugmentedReality)，是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术，这种技术的目标是在屏幕上把虚拟世界嵌套在现实世界展示并进行互动。AR系统具有三个突出的特点：真实世界和虚拟的信息集成；具有实时交互性；是在三维尺度空间中增添定位虚拟物体。AR技术可广泛应用于多个领域。AR实现原理，首先摄像头和传感器采集真实场景的视频或者图像，传入后台的处理单元对其进行分析和重构，并结合头部跟踪设备的数据来分析虚拟场景和真实场景的相对位置，实现坐标系的对齐并进行虚拟场景的融合计算；交互设备采集外部控制信号，实现对虚实结合场景的交互操作。系统融合后的信息会实时地显示在显示器中，展现在用户的视野中。当前的AR技术主要是基于摄像头和传感器采集的真实场景的视频或图像进行分析，语音进行辅助。在AR场景下的语音辅助作用，主要体现在两处：语音指令检测和语音指令编辑物体。语音指令检测是指，在检测识别上，重点检测图像和视频，语音指令检测用于强调增强辅助信息，如检测到人脸后，语音指令要求显示年龄和性别；语音指令编辑物体，是指在生成AR物体后，语音对AR物体的二维或三维信息进行编辑。现有技术存在的问题包括：(1)、缺乏基于声音的AR生成：当前主要是基于现实图像实现增强现实图像，语音只能进行辅助。不能完全基于声音输入生成AR内容，实现听觉信息的AR智能展示。(2)、被动化的语音触发AR方式：目前...

【技术保护点】
1.一种基于声音生成AR内容的方法，其特征在于，所述方法包括：步骤11：获取当前AR环境中的实时语音数据后，分别执行步骤131和步骤132；步骤131：判断所述实时语音数据是否包含说话人，如果是，则将所述实时语音数据中所述说话人的说话内容转换为文字，并提取所述文字的关键语义信息；步骤132：识别并提取所述实时语音数据中的人为非说话声音或自然界声音；步骤133：定位所述说话人、人为非说话声音或自然界声音的声源位置；步骤15：根据所述关键语义信息、人为非说话声音或自然界声音匹配所述实时语音数据对应的场景；步骤17：根据输入信息生成AR内容并显示，所述输入信息包括所述关键语义信息、人为非说话声音、自然界声音、所述声源位置、所述场景或所述AR环境中的真实场景图像。

【技术特征摘要】
1.一种基于声音生成AR内容的方法，其特征在于，所述方法包括：步骤11：获取当前AR环境中的实时语音数据后，分别执行步骤131和步骤132；步骤131：判断所述实时语音数据是否包含说话人，如果是，则将所述实时语音数据中所述说话人的说话内容转换为文字，并提取所述文字的关键语义信息；步骤132：识别并提取所述实时语音数据中的人为非说话声音或自然界声音；步骤133：定位所述说话人、人为非说话声音或自然界声音的声源位置；步骤15：根据所述关键语义信息、人为非说话声音或自然界声音匹配所述实时语音数据对应的场景；步骤17：根据输入信息生成AR内容并显示，所述输入信息包括所述关键语义信息、人为非说话声音、自然界声音、所述声源位置、所述场景或所述AR环境中的真实场景图像。2.根据权利要求1所述的方法，其特征在于，所述步骤15包括：步骤151：建立场景库，所述场景库至少包含一个场景；步骤152：通过聚类算法将所述场景库中的场景进行分类，分类依据为所述场景库中的每个场景的关键词信息、所包含的人为非说话声音和自然界声音；步骤153：将所述实时语音数据相关的关键语义信息、人为非说话声音或自然界声音与所述场景库进行匹配，其中匹配度最高的场景为所述实时语音数据对应的场景。3.根据权利要求2所述的方法，其特征在于，步骤153中，匹配算法为K最近邻分类算法。4.根据权利要求1所述的方法，其特征在于，所述步骤17中，所述输入信息还包括：所述AR环境中用户的...

【专利技术属性】
技术研发人员：张薇，葛玲玲，许馨月，李文轩，姚巍，吴楠楠，
申请(专利权)人：三星电子中国研发中心，三星电子株式会社，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人