当前位置: 首页 > 专利查询>DTS公司专利>正文

用于对话可懂度评估的方法和装置制造方法及图纸

技术编号:34906363 阅读:54 留言:0更新日期:2022-09-15 06:52
本公开提供了一种方法,包括:获得包括与非对话声音混音的对话的混音音轨;将混音音轨转换成比较文本;获得对话的参考文本作为对话的可懂度的参考;基于比较文本与参考文本的比较,确定混音音轨的对话对听者的可懂度的测量;以及报告对话的可懂度的测量。以及报告对话的可懂度的测量。以及报告对话的可懂度的测量。

【技术实现步骤摘要】
【国外来华专利技术】用于对话可懂度评估的方法和装置


[0001]本公开涉及评估音轨上对话的可懂度(intelligibility)。

技术介绍

[0002]在娱乐行业中,内容分发者将诸如电影和电视(TV)节目之类的视听内容流传输到消费者以供消费者消费该内容。关于音频,内容制作者面临的重大问题是消费者不断抱怨他们无法在家中正确听到和理解来自其流传输的内容的对话。解决该问题的常规方法试图通过传统的数字信号处理(DSP)技术来提高对话的语音可懂度,诸如提高人声频率范围。该常规方法一般假设DSP技术解决了“可理解性(understandability)”问题,但没有评估或解决消费者在附加处理之前或之后对对话的实际理解程度。这导致问题(即,消费者对对话可懂度差的抱怨)与其解决方案之间存在质量控制(QC)差距,从而使负责实现解决方案的内容制作者和/或音响工程师不知道他们是否真得充分解决了所报告的问题。
附图说明
[0003]图1是示例声音工程环境的框图,该环境用于评估和提高听者对音轨的对话的可懂度。
[0004]图2是由声音工程环境的对话分析器执行的使本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:获得包括与非对话声音混音的对话的混音音轨;将混音音轨转换成比较文本;获得对话的参考文本作为对话的可懂度的参考;基于比较文本与参考文本的比较,确定混音音轨的对话对听者的可懂度的测量;以及报告对话的可懂度的测量。2.如权利要求1所述的方法,其中转换包括使用自动语音识别(ASR)将混音音轨转换成比较文本。3.如权利要求1所述的方法,其中确定对话的可懂度的测量包括:基于比较计算混音音轨的时间切片的对话的可懂度的个体测量;以及基于对话的可懂度的个体测量计算对话的可懂度的测量。4.如权利要求3所述的方法,其中报告包括:显示对话的可懂度的测量和对话的可懂度的个体测量。5.如权利要求3所述的方法,其中:计算对话的可懂度的个体测量包括确定与混音音轨的时间切片对应的比较文本的片段与参考文本的片段中的对应片段之间的差异。6.如权利要求5所述的方法,其中报告包括:显示对话的可懂度的测量、对话的可懂度的个体测量、比较文本的片段以及参考文本的片段中的对应片段。7.如权利要求3所述的方法,还包括:生成为数字再现设备配置的并且至少包括对话的可懂度的个体测量的元数据。8.如权利要求1所述的方法,其中:参考文本包括跨越相应时间间隔的字幕文本的块;以及确定可懂度的测量包括确定(i)与混音音轨的时间切片对应的比较文本的片段与(ii)将共同对话传达给比较文本的片段的字幕文本的块中的对应块之间的个体差异。9.如权利要求8所述的方法,还包括:使用文本匹配算法将比较文本的片段与字幕文本的块中的对应块进行匹配,所述文本匹配算法使比较文本的每个片段与字幕文本的块中的匹配块之间的文本相似度最大化,其中确定个体差异包括基于匹配的结果确定个体差异。10.如权利要求1所述的方法,其中获得参考文本包括:将仅对话音轨转换成参考文本。11.如权利要求1所述的方法,其中获得参考文本包括接收对话的基于文本的字幕作为参考文本。12.如权利要求1所述的方法,其中获得混音音轨包括:接收包括与非对话声音混音的对话的原始混音音轨;以及用仿真声音效果对原始混音音轨进行声学修正以产生混音音轨,所述仿真声音效果仿真室内声学、声音再现系统回放声学和背景噪声中的一种或多种。13.如权利要求1所述的方法,其中转换包括:使用机器学习对话提取器,从混音音轨中提取对话以产生占主导地位的对话音轨;以
及将占主导地位的对话音轨转换成比较文本。14.如权利要求1所述的方法,其中确定对话的可懂度的测量包括计算比较文本与参考文本之间的差异,以及基于该差异计算对话的可懂度的测量。15.如权利要求14所述的方法,其中计算差异包括将差异计算为代表字母或单词的差异的文本距离,或者计算为代表声音...

【专利技术属性】
技术研发人员:D
申请(专利权)人:DTS公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1