【技术实现步骤摘要】
【国外来华专利技术】使用视频剪辑作为词典使用示例
技术介绍
[0001]除了定义之外,词典通常提供关于单词和/或短语的其他信息(本文称为“n元语法”),包括但不限于同义词、反义词、语音信息、词源信息和/或使用示例。特别地,使用示例对于试图理解给定单词或短语如何在各种上下文中使用的个人(本文有时称为“用户”)可能非常有益。纸质和电子形式两者的传统词典中提供的使用示例通常摘自文学作品、报纸等。
[0002]无论是电子的还是印制在纸上的,这些使用示例通常以印制形式提供,这可能无助于理解单词或短语的某些方面,诸如其发音(例如,一般地或区域性地)。此外,随着用户越来越多地通过具有自动化助手的口语人机对话来获取信息,包括单词/短语的词典定义,印制使用示例可能具有各种限制。例如,印制的使用示例的文本到语音(“TTS”)处理可以生成在上下文中使用的单词或短语的听觉输出,但是计算机生成的语音可能不一定捕捉到当单词/短语由人类说出时经常使用的正确发音或其他微妙的习惯用语。
[0003]电子视频文件可以与传达包含在电子视频文件中的口语对话和其他声音的文本数据相关联(例如,作为 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种使用一个或多个处理器实现的方法,包括:从电子视频文件的语料库中识别候选视频剪辑的集合,其中在所述集合的每个候选视频剪辑中在目标上下文中发声出目标n元语法;对于所述集合中的每个候选视频剪辑:将与所述候选视频剪辑相关联的预先存在的手动字幕与基于所述候选视频剪辑的音频部分的语音识别处理而生成的文本进行比较,以及至少部分基于所述比较,为所述候选视频剪辑计算作为词典使用示例的适合性的度量;基于作为词典使用示例的适合性的度量,从所述候选视频剪辑的集合中选择候选视频剪辑中的一个或多个视频剪辑;以及在可搜索数据库中将所选择的一个或多个视频剪辑与所述目标n元语法相关联。2.根据权利要求1所述的方法,其中所述识别还包括对与所述电子视频文件相关联的文本执行自然语言处理,以识别在所述目标上下文中发声出所述目标n元语法的文本。3.根据权利要求1或2所述的方法,其中所述识别还包括将从与所述电子视频文件相关联的文本生成的文本嵌入作为输入应用于训练的机器学习模型以生成输出,其中所述输出用于识别其中所述目标n元语法在所述目标上下文中被发声出的候选视频剪辑的集合。4.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑中说话者在所述目标上下文中发声出所述目标n元语法时检测到的所述说话者的凝视。5.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑中说话者在所述目标上下文中发声出所述目标n元语法时检测到的所述说话者的姿势。6.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑的检测到的背景噪声水平或所述候选视频剪辑中发声出的语音的测量的语速。7.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑的流行度度量。8.根据前述权利要求中任一项所述的方法,其中所述计算还基于寻找关于所述目标n元语法的信息的给定用户先前已经观看过所述候选视频剪辑的确定。9.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑中的目标n元语法的说话者的身份或者帮助创建所述候选视频剪辑的工作人员的身份。10.根据前述权利要求中任一项所述的方法,其中所述计算还基于所述候选视频剪辑中的目标n元语法的说话者的口音。11.根据前述权利要求中任一项所述的方法,其中一个或多个选择的视频剪辑包括多个选择的视频剪辑。12.根据权利要求11所述的方法,其中所述方法还包括使所述多个视频剪辑按顺序一个接一个地播放。13.根据权利要求11或12所述的方法,其中所述方法还包括使图形用户界面(GUI)呈现在客户端设备上,其中所述GUI可由用户操作以滑动浏览...
【专利技术属性】
技术研发人员:T斯尼尔,S艾格,Z阿基瓦,GB阿姆朗,T科恩,R达安,S戈尔德施坦,Y马蒂亚斯,S奥古拉,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。