【技术实现步骤摘要】
【国外来华专利技术】传送标识当前说话者的元数据
技术介绍
基于网络的会议服务可以包括诸如互联网语音协议(VoIP)音频会议、视频会议、即时消息传送和桌面共享之类的特征,以允许在线会议的参与者实时地进行通信并且同时查看在通信会话期间呈现的文档和/或在通信会话期间呈现的文档上工作。当参加在线会议时,会议发起者或被邀请方可以使用个人计算机、移动设备和/或座机电话连接至基于web的会议服务,并且可以被提示提供帐户信息或身份,以及在一些情况下,会议标识符。在线会议的参与者可以在不同时间充当发言人或参加者,并且可以通过说话、收听、聊天、呈现共享文档和/或查看共享文档进行交流和协作。
技术实现思路
提供以下
技术实现思路
以简化形式介绍下文在具体实施方式中进一步描述的一些概念的选择。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或基本特征,也不旨在用于限制所要求保护的主题的范围。在各种实现方式中,一种计算机系统可以传送标识当前说话者的元数据。该计算机系统可以接收表示当前说话者的语音的音频数据,基于该音频数据来生成当前说话者的音频指纹,以及通过将当前说话者的音频指纹与包含在说话者指纹存储库中的、已存储音频指纹进行比较来执行自动的说话者识别。计算机系统可以向观察者的客户端设备传送指示当前说话者未被识别的数据,并且从观察者的客户端设备接收标识当前说话者的标记信息。计算机系统可以将当前说话者的音频指纹和标识当前说话者的元数据存储在说话者指纹存储库中,并且向观察者的客户端设备中的至少一个客户端设备或者不同观察者的客户端设备传送标识当前说话者的元数据。通过阅读以下具体实施方式和对附图的观察,这些和其他特征和优 ...
【技术保护点】
一种用于传送标识当前说话者的元数据的计算机系统,所述计算机系统包括:处理器,被配置成执行计算机可执行指令;以及存储器,存储计算机可执行指令,所述计算机可执行指令被配置成:基于表示所述当前说话者的语音的音频数据,来生成所述当前说话者的音频指纹;通过将所述当前说话者的所述音频指纹与被包含在说话者指纹存储库中的已存储音频指纹进行比较,来执行自动说话者识别;向观察者的客户端设备传送指示所述当前说话者未被识别的数据;从所述观察者的所述客户端设备接收标识所述当前说话者的标记信息;将所述当前说话者的所述音频指纹和标识所述当前说话者的元数据存储在所述说话者指纹存储库中;以及向所述观察者的所述客户端设备或不同观察者的客户端设备中的至少一个客户端设备,传送标识所述当前说话者的所述元数据。
【技术特征摘要】
【国外来华专利技术】2015.03.20 US 14/664,0471.一种用于传送标识当前说话者的元数据的计算机系统,所述计算机系统包括:处理器,被配置成执行计算机可执行指令;以及存储器,存储计算机可执行指令,所述计算机可执行指令被配置成:基于表示所述当前说话者的语音的音频数据,来生成所述当前说话者的音频指纹;通过将所述当前说话者的所述音频指纹与被包含在说话者指纹存储库中的已存储音频指纹进行比较,来执行自动说话者识别;向观察者的客户端设备传送指示所述当前说话者未被识别的数据;从所述观察者的所述客户端设备接收标识所述当前说话者的标记信息;将所述当前说话者的所述音频指纹和标识所述当前说话者的元数据存储在所述说话者指纹存储库中;以及向所述观察者的所述客户端设备或不同观察者的客户端设备中的至少一个客户端设备,传送标识所述当前说话者的所述元数据。2.根据权利要求1所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令被配置成:通过基于由大多数观察者所提供的身份而标识所述当前说话者,来解决冲突的标记信息。3.根据权利要求1或2所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令被配置成:从信息源取回用于所述当前说话者的附加信息;以及传送在标识所述当前说话者的所述元数据中的所述附加信息。4.根据权利要求1至3中的任一项所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令被配置成:生成增强音频数据,所述增强音频数据包括表示所述当前说话者的语音的所述音频数据和标识所述当前说话者的所述元数据。5.根据权利要求4所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令被配置成:存储所述增强音频数据;接收指示所识别的说话者的查询;从所述增强音频数据搜索标识所述所识别的说话者的元数据;以及输出所述增强音频数据的部分,所述增强音频数据的所述部分表示所述所识别的说话者的语音。6.根据权利要求1至5中的任一项所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令被配置成:生成具有多个说话者的会话的转录,其中由所识别的说话者所说出的语音的文本与所述所识别的说话者的标识符相关联;存储所述转录;接收指示所述所识别的说话者的查询;从所述转录中搜索所述所识别的说话者的所述标识符;以及输出所述转录的部分,所述转录的所述部分包括由所述所识别的说话者说出的语音文本。7.根据权利要求1至6中的任一项所述的计算机系统,其中所述存储器还存储计算机可执行指令,所述计算机可执行指令...
【专利技术属性】
技术研发人员:G·卡施坦,B·施莱辛格,H·菲特斯,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。