一种完整采集对话双方对话内容的装置制造方法及图纸

技术编号:25407609 阅读:19 留言:0更新日期:2020-08-25 23:10
本发明专利技术公开了一种完整采集对话双方对话内容的装置,属于声音采集技术领域,包括:耳机设备;手机端;设置于耳机设备内的麦克风声音采集单元,用于实现音频的采集;远程控制交互单元,耳机设备与手机端之间通过远程控制交互单元建立蓝牙协议,手机端发送控制指令给耳机设备,控制指令包括启动、停止音频采集操作;蓝牙立体声音频收发单元,耳机设备与手机端之间通过蓝牙立体声音频收发单元实现音频的收发,耳机设备发射音频,手机端接收音频;本发明专利技术提供一种方便佩戴并且能取得更好的对话内容采集效果的设备,对话中不必单独摆放或手持,且可以高精度的采集双方对话内容,方便事后进行对话数据分析、提升工作效率。

【技术实现步骤摘要】
一种完整采集对话双方对话内容的装置
本专利技术涉及声音采集
,更具体地说,涉及一种完整采集对话双方对话内容的装置。
技术介绍
本专利技术主要基于两方面背景:一是近年人工智能技术,特别是降噪、语音识别、语义理解等领域技术的快速发展;二是可穿戴电子设备的软硬件技术快速成熟,并在消费者中得到广泛使用。近年来,随着深度学习技术的引入,降噪、语音识别、语义理解等领域技术得到快速发展,在学术界和工业界各种主流的算法效果评测中,普遍取得10%以上的准确率提升,个别场景下甚至有接近或超越人类评测者的表现,达到实用水平,算法模型效果的迅速提升为本专利技术中的软件部分提供了良好的基础。另一方面,随着国内外主流消费电子产品企业的大力研发与营销推广,智能手环、智能手机、智能耳机等可穿戴电子设备市场渗透率迅速提高,在消费者中得到广泛的使用,此类产品的整机设备、重点模组供应链的成熟,为本专利技术中的硬件部分提供了良好的基础。当前,在记者采访、高客单价产品销售、重要会议等场景,用户大量使用包含麦克风阵列的录音笔、手机等设备进行双方对话内容的录音采集,方便留存记录、事后回放、整理纪要等工作,此类产品普遍需要单独携带,并在对话中静止摆放或手持在与各声源无遮挡的位置进行录音采集,带来使用的不便;此外,因为拾音距离距双方都较远,在当前技术水平下远场拾音后语音识别的准确率均远低于近场拾音水平,影响了事后软件自动分析的效果,限制了借助人工智能技术提升对话数据分析、提升工作效率的可能性。
技术实现思路
1.要解决的技术问题针对现有技术中存在的问题,本专利技术的目的在于提供一种完整采集对话双方对话内容的装置,它提供一种方便佩戴并且能取得更好的对话内容采集效果的设备,对话中不必单独摆放或手持,且可以高精度的采集双方对话内容,方便事后进行对话数据分析、提升工作效率。2.技术方案为解决上述问题,本专利技术采用如下的技术方案:一种完整采集对话双方对话内容的装置,包括:耳机设备;手机端;设置于耳机设备内的麦克风声音采集单元,用于实现音频的采集;远程控制交互单元,所述耳机设备与手机端之间通过远程控制交互单元建立蓝牙协议,所述手机端发送控制指令给耳机设备,所述控制指令包括启动、停止音频采集操作;蓝牙立体声音频收发单元,所述耳机设备与手机端之间通过蓝牙立体声音频收发单元实现音频的收发,所述耳机设备发射音频,所述手机端接收音频;设置于手机端内的声学处理单元,用于实现音频的处理,提供一种方便佩戴并且能取得更好的对话内容采集效果的设备,对话中不必单独摆放或手持,且可以高精度的采集双方对话内容,方便事后进行对话数据分析、提升工作效率。作为本专利技术的一种优选方案,所述耳机设备设置有左耳佩戴设备和右耳佩戴设备。作为本专利技术的一种优选方案,所述远程控制交互单元由三个远程控制交互模块组成,其中两个所述远程控制交互模块分别设置于左耳佩戴设备和右耳佩戴设备内,另一个所述远程控制交互模块设置于手机端内。作为本专利技术的一种优选方案,所述麦克风声音采集单元由两个麦克风1声音采集模块和两个麦克风2声音采集模块组成,其中一个麦克风1声音采集模块和麦克风2声音采集模块设置于左耳佩戴设备内,另一个所述麦克风1声音采集模块和麦克风2声音采集模块设置于右耳佩戴设备内。作为本专利技术的一种优选方案,所述蓝牙立体声音收发单元由两个蓝牙立体声音频传输规范发射端和两个蓝牙立体声音频传输规范接收端,两个所述蓝牙立体声音频传输规范发射端分别设置于左耳佩戴设备和右耳佩戴设备内,两个所述蓝牙立体声音频传输规范接收端均设置于手机端内,两个所述蓝牙立体声音频传输规范接收端分别接收两个蓝牙立体声音频传输规范发射端发射的音频。作为本专利技术的一种优选方案,所述声学处理单元包括:话者分离模块,用于提取短时能量、过零率、梅尔倒谱系数音频特征;近端波束形成模块,用于波束形成计算,输出近端声源方位、时延;远端波束形成模块,用于波束形成计算,输出远端声源方位、时延;噪声抑制、回声抵消、混响消除模块,用于进行声音信号的融合、降噪、人声增强计算;音频编码模块,用于编码;本地存储模块,用于本地存储;云端传输模块,用于云端传输。作为本专利技术的一种优选方案,所述左耳佩戴设备和右耳佩戴设备内均设置有音频编解码模块、蓝牙驱动模块、输入输出接口模块、数字信号处理模块、中央处理器模块和内存、储存模块,所述音频编解码模块、蓝牙驱动模块、输入输出接口模块、数字信号处理模块、和内存、储存模块均与中央处理器模块之间电性连接。一种完整采集对话双方对话内容的方法,包括如下步骤:S1、用户通过手机端应用软件,向手机端的远程控制交互模块发起指令,进行启动、停止音频采集操作;S2、手机端的远程交互控制模块通过蓝牙协议与左耳佩戴设备、右耳佩戴设备上的远程交互控制模块建立连接,发送控制指令,启动、停止音频采集操作;S3、在左耳佩戴设备、右耳佩戴设备上,远程控制交互模块控制麦克风1声音采集模块和麦克风2声音采集模块进行音频的采集;S4、在左耳佩戴设备、右耳佩戴设备上,远程控制交互模块将采集到的2路声音信号,传递给蓝牙立体声音频传输规范发射端;S5、在左耳佩戴设备、右耳佩戴设备上,蓝牙立体声音频传输规范发射端将2个麦克风提取的声音统一通过蓝牙协议下的立体声音频传输规范,传输到手机端对应的蓝牙立体声音频传输规范接收端;S6、手机端上的声学处理单元统一接收到2组共计4路音频信号,进行具体的音频处理计算。3.有益效果相比于现有技术,本专利技术的优点在于:(1)本方案作为佩戴式设备,无需对话中专门手持或在对话双方中间摆放一个单独的设备,方便使用。(2)佩戴者一侧声音采集质量提升:基于录音笔等现有技术手段进行日常面对面对话的声音采集后,实际中对双方对话内容进行语音识别等计算得到的字准确率在50-70%之间;基于本专利技术中的技术,针对对话对方的对话内容采集识别质量接近,但在佩戴者一侧采集效果接近呼叫中心电话通话质量,进行语音识别等计算得到的字准确率在80-90%之间,有明显的准确率提升。附图说明图1为本专利技术一种完整采集对话双方对话内容的装置的整体硬件结构图;图2为本专利技术一种完整采集对话双方对话内容的装置中的耳机设备硬件模块图;图3本专利技术一种完整采集对话双方对话内容的装置的软件模块图。具体实施方式下面将结合本专利技术实施例中的附图对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”、“顶/底端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描本文档来自技高网...

【技术保护点】
1.一种完整采集对话双方对话内容的装置,其特征在于,包括:/n耳机设备;/n手机端;/n设置于耳机设备内的麦克风声音采集单元,用于实现音频的采集;/n远程控制交互单元,所述耳机设备与手机端之间通过远程控制交互单元建立蓝牙协议,所述手机端发送控制指令给耳机设备,所述控制指令包括启动、停止音频采集操作;/n蓝牙立体声音频收发单元,所述耳机设备与手机端之间通过蓝牙立体声音频收发单元实现音频的收发,所述耳机设备发射音频,所述手机端接收音频;/n设置于手机端内的声学处理单元,用于实现音频的处理。/n

【技术特征摘要】
1.一种完整采集对话双方对话内容的装置,其特征在于,包括:
耳机设备;
手机端;
设置于耳机设备内的麦克风声音采集单元,用于实现音频的采集;
远程控制交互单元,所述耳机设备与手机端之间通过远程控制交互单元建立蓝牙协议,所述手机端发送控制指令给耳机设备,所述控制指令包括启动、停止音频采集操作;
蓝牙立体声音频收发单元,所述耳机设备与手机端之间通过蓝牙立体声音频收发单元实现音频的收发,所述耳机设备发射音频,所述手机端接收音频;
设置于手机端内的声学处理单元,用于实现音频的处理。


2.根据权利要求1所述的一种完整采集对话双方对话内容的装置,其特征在于,所述耳机设备设置有左耳佩戴设备和右耳佩戴设备。


3.根据权利要求2所述的一种完整采集对话双方对话内容的装置,其特征在于,所述远程控制交互单元由三个远程控制交互模块组成,其中两个所述远程控制交互模块分别设置于左耳佩戴设备和右耳佩戴设备内,另一个所述远程控制交互模块设置于手机端内。


4.根据权利要求3所述的一种完整采集对话双方对话内容的装置,其特征在于,所述麦克风声音采集单元由两个麦克风1声音采集模块和两个麦克风2声音采集模块组成,其中一个麦克风1声音采集模块和麦克风2声音采集模块设置于左耳佩戴设备内,另一个所述麦克风1声音采集模块和麦克风2声音采集模块设置于右耳佩戴设备内。


5.根据权利要求4所述的一种完整采集对话双方对话内容的装置,其特征在于,所述蓝牙立体声音收发单元由两个蓝牙立体声音频传输规范发射端和两个蓝牙立体声音频传输规范接收端,两个所述蓝牙立体声音频传输规范发射端分别设置于左耳佩戴设备和右耳佩戴设备内,两个所述蓝牙立体声音频传输规范接收端均设置于手机端内,两个所述蓝牙立体声音频传输规范接收端分别接收两个蓝牙立体声音频传输规范发射端发射的音频。


6.根据权利要求1-5任...

【专利技术属性】
技术研发人员:秦垠峰闫冰
申请(专利权)人:上海紫荆桃李科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1