使用隐藏字幕作为用于隐藏字幕定制系统的并行训练数据技术方案

技术编号：34084464 阅读：26 留言：0更新日期：2022-07-11 19:39

提供了用于定制自动隐藏字幕系统的方法、装置和计算机程序产品。在一些实施例中，在数据使用(DU)位置处，提供包括基本模型的自动隐藏字幕系统，检索标准被定义为从一个或多个数据收集(DC)位置请求，将基于所述检索标准的检索请求发送给所述一个或多个DC位置，响应于所述检索请求接收来自所述一个或多个DC位置的相关隐藏字幕数据，通过以下方式处理所述接收的相关隐藏字幕数据：计算所述接收的相关隐藏字幕数据的多个数据子集中的每个数据子集的置信度分数，并且基于所述置信度分数选择所述数据子集中的一个或多个数据子集，以及通过使用所选择的一个或多个数据子集来训练所述基本模型，定制所述自动隐藏字幕系统。定制所述自动隐藏字幕系统。定制所述自动隐藏字幕系统。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用隐藏字幕作为用于隐藏字幕定制系统的并行训练数据

技术介绍

[0001]本专利技术总体上涉及隐藏字幕领域。更具体地，本专利技术涉及定制自动隐藏字幕系统。

技术实现思路

[0002]本公开的实施例包括用于定制自动隐藏字幕系统的方法、装置和计算机程序产品。在一些实施例中，在数据使用(DU)位置处，提供包括基本模型(例如，声学模型、语言模型和词汇表等)的自动隐藏字幕系统，定义检索标准以请求从一个或多个数据收集(DC)位置检索标准，将基于所述检索标准的检索请求发送至所述一个或多个DC位置中的每一个，响应于所述检索请求，接收来自所述一个或多个DC位置中的每一个的相关隐藏字幕数据，通过以下方式来处理所述接收的相关隐藏字幕数据：计算所述接收的相关隐藏字幕数据的多个数据子集中的每一个的置信度得分，并且基于所述置信度得分，选择所述数据子集中的一个或多个，以及通过使用所选择的一个或多个数据子集来训练所述基本模型，定制所述自动隐藏字幕系统。在一些实施例中，在一个或多个DC位置中的每个处，收集和管理隐藏字幕数据，基于检索请求选择相关的隐藏字幕数据，并且将相...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种定制自动隐藏字幕系统的方法，所述方法包括：在数据使用(DU)位置处提供包括基本模型的自动隐藏字幕系统；在DU位置处定义从一个或多个数据收集(DC)位置请求的检索标准；向所述一个或多个DC位置中的每一个发送检索请求，其中，所述检索请求基于所述检索标准；响应于所述检索请求，在所述DU位置处从所述一个或多个DC位置中的每一个接收相关隐藏字幕数据；在所述DU位置处处理接收的相关隐藏字幕数据，其中，处理操作包括：计算接收的相关隐藏字幕数据的多个数据子集中的每一个的置信度得分，并且基于选择的一个或多个数据子集中的每一个的所述置信度得分，选择所述数据子集中的一个或多个数据子集；在所述DU位置处定制所述自动隐藏字幕系统，其中，定制操作包括使用所选择的一个或多个数据子集来训练所述基本模型。2.根据权利要求1所述的方法，所述方法进一步包括：在所述一个或多个DC位置中的每一个处，收集隐藏字幕数据；在所述一个或多个DC位置中的每一个处，管理所收集的隐藏字幕数据；在所述一个或多个DC位置中的每一个处，基于所述检索请求从收集和管理的隐藏字幕数据中选择相关的隐藏字幕数据；从所述一个或多个DC位置中的每一个处，向所述DU位置发送所述相关的隐藏字幕数据。3.根据权利要求2所述的方法，其中，在所述一个或多个DC位置的每一个处，管理收集的隐藏字幕数据包括：利用可检索定位器标记收集的隐藏字幕数据，所述可检索定位器将收集的隐藏字幕数据的至少一部分识别为新闻隐藏字幕或者广告隐藏字幕。4.根据权利要求2所述的方法，其中，在所述一个或多个DC位置中的每一个处，管理收集的隐藏字幕数据包括：利用可检索定位符标记收集的隐藏字幕数据，所述可检索定位符根据时间顺序识别收集的隐藏字幕数据的至少一部分，其中，所述可检索定位符包括广播的日、月和年。5.根据权利要求2所述的方法，其中，在所述一个或多个DC位置中的每一个处，管理收集的隐藏字幕数据包括：利用可检索定位符标记收集的隐藏字幕数据，所述可检索定位符根据内容识别收集的隐藏字幕数据的至少一部分，其中，所述可检索定位符选自由国际新闻、国家新闻、地方新闻、体育、天气以及谈话节目组成的组。6.根据权利要求2所述的方法，其中，在所述一个或多个DC位置中的每一个处，管理收集的隐藏字幕数据包括：利用可检索定位器标记收集的隐藏字幕数据，所述可检索定位器根据元数据和/或关键字识别收集的隐藏字幕数据的至少一部分。7.根据权利要求2所述的方法，其中，在所述一个或多个DC位置中的每一个处，管理收集的隐藏字幕数据包括：将收集的所述隐藏字幕数据转换成选自由以下各项所组成的组中的嵌入：词频
‑
逆文档频率(TF
‑
IDF)嵌入、单词嵌入以及句子嵌入。8.根据权利要求2所述的方法，其中，在所述一个或多个DC位置中的每一个处，管理收集的隐藏字幕数据包括：使收集的隐藏字幕数据与对应的音频记录配对。9.根据权利要求1所述的方法，其中，在所述DU位置处定义从一个或多个DC位置请求的
检索标准包括定义检索标准，以利于检索与一个或多个期望目标相关的隐藏字幕数据。10.根据权利要求1所述的方法，其中，在所述DU位置处定义从一个或多个DC位置请求的检索标准包括定义检索标准，以利于检索相对于期望数据集检索相关的隐藏字幕数据。11.根据权利要求10所述的方法，进一步包括：使用所述基本模型在所述DU位置处解码与所述期望数据集对应的音频记录，以产生用作种子数据的解码数据；其中，在DU位置处定义从一个或多个DC位置请求的检索标准包括使用解码数据作为用于直接文本检索的检索标准。12.根据权利要求11所述的方法，进一步包括：在所述DU位置处，使用所述解码数据来构建语言模型；在所述DU位置处，使用所述语言模型对从所述一个或多个DC位置中的每一个接收的作为所述相关隐藏字幕数据的文本进行评分。13.根据权利要求10所述的方法，进一步包括：使用所述基本模型在所述DU位置处解码与所述期望数据集对应的音频记录，以产生用作种子数据的解码数据；在所述DU位置处将所述解码数据转换成嵌入；其中，在所述DU位置处定义从一个或多个DC位置请...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人