基于语音语义的视频播放方法技术

技术编号:25989258 阅读:43 留言:0更新日期:2020-10-20 18:57
本发明专利技术公开了基于语音语义的视频播放方法,包括:视频控制终端接收用户的语音信息,并解析出所述语音对应的文本信息作为待理解的文本;视频控制终端对所述待理解的文本进行语义理解,得到语义理解结果,并依据语义理解结果搜索视频,并根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上;所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频。本发明专利技术同时采用短文本词语和长文本“句子”的形式进行匹配,进一步提高了匹配的精确性。此外,本发明专利技术将语义理解数据库建立在本地,节省网络资源,不仅提高了检索速度,而且检索精确性提高,一举多得。

【技术实现步骤摘要】
基于语音语义的视频播放方法
本专利技术属于智能机器人
,涉及基于语音语义的视频播放方法。
技术介绍
智能机器人具有相当发达的“大脑”,在脑中起作用的是中央处理器,部分智能机器人通过计算机系统与操作员或程序员进行人-机对话,实现对机器人的控制与操作,能够独立地实现一些诸如轨迹规划、简单的避障、播放音视频等功能,但是还要受到外部的控制。目前市场上有很多诸如此类的机器人产品。但绝大多数机器人产品的检索功能不够准确,在用户进行人机互动语音交互过程中,经常不能得到自己所需要的检索结果,需要反复更换几种不同的关键词句的说法才能够获得所需要的音视频,影响用户的使用体验,因此,如何提供一种准确快速精确找到用户所需要的音视频文件是目前需要改进的一个技术问题。
技术实现思路
本专利技术的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。本专利技术还有一个目的是提供基于语音语义的视频播放方法。为此,本专利技术提供的技术方案为:基于语音语义的视频播放方法,包括如下步骤:步骤一、视频控制终端接收用户的语音信息,并解析出所述语音对应的文本信息作为待理解的文本;步骤二、视频控制终端对所述待理解的文本进行语义理解,得到语义理解结果,并依据语义理解结果搜索视频,并根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上;其中,语义理解的具体方法包括如下步骤:2.1)建立语义理解数据库:所述语义理解数据库包含短文本匹配数据库和长文本匹配数据库,所述短文本匹配数据库包括多组匹配词语,每组匹配词语均包括语义相近的多个词语及多个辅助词语,所述辅助词语由上述语义相近的多个词语的反义词及反义词前的“非”或“不”字组成;所述长文本匹配数据库包括多组匹配句子,每组匹配句子均包括多个语义相近的句子;2.2)匹配:若所述待理解的文本的字个数少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本仅与所述短文本匹配数据库进行匹配,并输出匹配结果作为语义理解结果;若所述待理解的文本的字个数不少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本与所述短文本匹配数据库和所述长文本匹配数据库分别进行匹配,并输出匹配结果作为语义理解结果;步骤三、所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频。优选的是,所述的基于语音语义的视频播放方法中,步骤2.2)中,当所述待理解的文本的字个数不少于所述长文本匹配数据库中的句子包含的字个数时,以与所述长文本匹配数据库的匹配结果作为优先级别的理解结果,并排序在与所述短文本匹配数据库的匹配结果之前。优选的是,所述的基于语音语义的视频播放方法中,步骤三中,所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频的具体步骤包括:所述视频终端向用户发出视频搜索结果选择的语音交互信息,用户响应所述视频控制终端发出的语音交互信息,发出包含所述视频搜索结果中的视频的序号信息的语音指令;所述视频控制终端接收用户的语音指令并进行响应,播放用户选择的序号对应的视频。优选的是,所述的基于语音语义的视频播放方法中,所述短文本匹配数据库中的词语的字个数均不多于5个汉字。优选的是,所述的基于语音语义的视频播放方法中,所述长文本匹配数据库中的句子的字个数均不少于6个汉字。优选的是,所述的基于语音语义的视频播放方法中,当根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上时:对视频搜索结果中的每个视频进行排序,与所述语义理解结果的相关性最高的视频序号为1,随相关性降低其他视频的序号逐个依次增加1。优选的是,所述的基于语音语义的视频播放方法中,所述视频控制终端还收录用户输入的语音指令中解析出的待理解的文本作为新的语义理解数据库。本专利技术至少包括以下有益效果:本专利技术的基于语音语义的视频播放方法中,采用短文本匹配数据库和长文本匹配数据库作为待理解文本的匹配数据库,尤其短文本匹配数据库中包含的多个辅助词语,所述辅助词语由上述语义相近的多个词语的反义词及反义词前的“非”或“不”字组成,比如语义相近的多个词语“金光闪闪”、“金碧辉煌”、“金色”等词语时,辅助词语包含“非金色”、“非金碧辉煌”、“非金光闪闪”等词语,以尽可能多得搜索到相近的结果。并且,本专利技术还设置有长文本匹配数据库,比如“介绍火锅的做法”这一个句子,在进行语义理解时,长文本匹配数据库中包含“火锅的新做法的说明”、“请看重庆火锅的做法”、“XX做麻辣烫视频”、“四川冒菜的创新做法”等等句子,使匹配结果更加精确。并且,采用“句子”的形式进行匹配,进一步提高了匹配的精确性。此外,本专利技术将语义理解数据库建立在本地,节省网络资源,不仅提高了检索速度,而且检索精确性提高,一举多得。此外,所述视频控制终端还收录用户输入的语音指令中解析出的待理解的文本作为新的语义理解数据库,这样能够根据用户的使用习惯建立和完善本地的语义理解数据库,提高用户的使用体验。本专利技术将与所述长文本匹配数据库的匹配结果作为优先级别的理解结果,并排序在与所述短文本匹配数据库的匹配结果之前。以便使得排序在前的视频与用户需检索的视频匹配度更高。本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。具体实施方式下面对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。本专利技术提供基于语音语义的视频播放方法,包括如下步骤:步骤一、视频控制终端接收用户的语音信息,并解析出所述语音对应的文本信息作为待理解的文本;步骤二、视频控制终端对所述待理解的文本进行语义理解,得到语义理解结果,并依据语义理解结果搜索视频,并根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上;其中,语义理解的具体方法包括如下步骤:2.1)在智能机器人的存储介质中建立语义理解数据库:所述语义理解数据库包含短文本匹配数据库和长文本匹配数据库,所述短文本匹配数据库包括多组匹配词语,每组匹配词语均包括语义相近的多个词语及多个辅助词语,所述辅助词语由上述语义相近的多个词语的反义词及反义词前的“非”或“不”字组成;所述长文本匹配数据库包括多组匹配句子,每组匹配句子均包括多个语义相近的句子;2.2)匹配:若所述待理解的文本的字个数少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本仅与所述短文本匹配数据库进行匹配,并输出匹配结果作为语义理解结果;若所述待理解的文本的字个数不少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本与所述短文本匹配数据库和所述长文本匹配数据库分别进行匹配,并输出匹配结果作为语义理解结果;步骤三、所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频。本专利技术的基于本文档来自技高网...

【技术保护点】
1.基于语音语义的视频播放方法,其特征在于,包括如下步骤:/n步骤一、视频控制终端接收用户的语音信息,并解析出所述语音对应的文本信息作为待理解的文本;/n步骤二、视频控制终端对所述待理解的文本进行语义理解,得到语义理解结果,并依据语义理解结果搜索视频,并根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上;/n其中,语义理解的具体方法包括如下步骤:/n2.1)建立语义理解数据库:所述语义理解数据库包含短文本匹配数据库和长文本匹配数据库,所述短文本匹配数据库包括多组匹配词语,每组匹配词语均包括语义相近的多个词语及多个辅助词语,所述辅助词语由上述语义相近的多个词语的反义词及反义词前的“非”或“不”字组成;所述长文本匹配数据库包括多组匹配句子,每组匹配句子均包括多个语义相近的句子;/n2.2)匹配:若所述待理解的文本的字个数少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本仅与所述短文本匹配数据库进行匹配,并输出匹配结果作为语义理解结果;/n若所述待理解的文本的字个数不少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本与所述短文本匹配数据库和所述长文本匹配数据库分别进行匹配,并输出匹配结果作为语义理解结果;/n步骤三、所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频。/n...

【技术特征摘要】
1.基于语音语义的视频播放方法,其特征在于,包括如下步骤:
步骤一、视频控制终端接收用户的语音信息,并解析出所述语音对应的文本信息作为待理解的文本;
步骤二、视频控制终端对所述待理解的文本进行语义理解,得到语义理解结果,并依据语义理解结果搜索视频,并根据相关性将视频搜索结果展示在所述视频控制终端的屏幕上;
其中,语义理解的具体方法包括如下步骤:
2.1)建立语义理解数据库:所述语义理解数据库包含短文本匹配数据库和长文本匹配数据库,所述短文本匹配数据库包括多组匹配词语,每组匹配词语均包括语义相近的多个词语及多个辅助词语,所述辅助词语由上述语义相近的多个词语的反义词及反义词前的“非”或“不”字组成;所述长文本匹配数据库包括多组匹配句子,每组匹配句子均包括多个语义相近的句子;
2.2)匹配:若所述待理解的文本的字个数少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本仅与所述短文本匹配数据库进行匹配,并输出匹配结果作为语义理解结果;
若所述待理解的文本的字个数不少于所述长文本匹配数据库中的句子包含的字个数,则将所述待理解的文本与所述短文本匹配数据库和所述长文本匹配数据库分别进行匹配,并输出匹配结果作为语义理解结果;
步骤三、所述视频控制终端与用户发生语音交互并播放用户选择的其中一个视频。


2.如权利要求1所述的基于语音语义的视频播放方法,其特征在于,步骤2.2)中,当所述待理解的文本的字个数不少于所述长文本匹配数据库...

【专利技术属性】
技术研发人员:王俊清
申请(专利权)人:漳州龙文维克信息技术有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1