视频内容的拓展方法、装置、终端设备及存储介质制造方法及图纸

技术编号：26031657 阅读：67 留言：0更新日期：2020-10-23 21:09

本申请适用于人工智能技术领域，提供了视频内容的拓展方法、装置、终端设备及存储介质，方法包括：提取视频图像中的文本内容的待拓展词；确定所述待拓展词的知识库链接词；根据所述知识库链接词，将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。从而对不同场景下的视频图像进行内容拓展，进而能够显示视频图像中出现的专业知识点的知识解释，丰富视频内容的展示方式，使得视频图像能够适用于更多的应用场景。

全部详细技术资料下载

【技术实现步骤摘要】
视频内容的拓展方法、装置、终端设备及存储介质
本申请属于人工智能
，尤其涉及视频内容的拓展方法、装置、终端设备及存储介质。
技术介绍
随着互联网的不断升级，短视频、视频直播等媒体逐渐进入人们的视野，越来越多的用户参与教育直播课、网络公开课等在线教育。相比于传统的线下课堂，在线教育能够给用户带来诸多便利，但是也非常考验用户的自主学习能力。在相关技术中，在线教育视频中经常会出现专业术语或专有名词，若用户不知道专业术语或专有名词的含义时，则需要自行查阅百度百科或维基百科等知识库。由此可见，目前的视频显示方式仅能够显示原有的视频内容，显示内容单一，在专业知识点较多的教学场景中无法发挥重要作用，难以适用于专业教学场景，存在适用范围小的问题。
技术实现思路
本申请实施例提供了视频内容的拓展方法、装置、终端设备及存储介质，可以解决当前的视频内容显示方式存在适用范围小的问题。第一方面，本申请实施例提供了一种视频内容的拓展方法，包括：提取视频图像中的文本内容的待拓展词；确定待拓展词的知识库链接词；根据知识库链接词，将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容。本申请实施例提供的视频内容的拓展方法，通过提取视频图像中的文本内容的待拓展词，从而能够自动识别出视频图像中出现专有名词或专业术语，并确定待拓展词的知识库链接词，从而能够确定链接预设知识库的知识库链接词，以及根据知识库链接词，将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容，从而对...

【技术保护点】
1.一种视频内容的拓展方法，其特征在于，包括：/n提取视频图像中的文本内容的待拓展词；/n确定所述待拓展词的知识库链接词；/n根据所述知识库链接词，将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。/n

【技术特征摘要】
1.一种视频内容的拓展方法，其特征在于，包括：
提取视频图像中的文本内容的待拓展词；
确定所述待拓展词的知识库链接词；
根据所述知识库链接词，将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。

2.如权利要求1所述的视频内容的拓展方法，其特征在于，所述提取视频图像中的文本内容的待拓展词，包括：
提取所述视频图像中的文本内容的多个关键词；
基于多个所述关键词，确定所述文本内容的所述待拓展词。

3.如权利要求2所述的视频内容的拓展方法，其特征在于，所述提取所述视频图像中的文本内容的多个关键词，包括：
对所述文本内容进行分词，得到多个单词；
根据预设TF-IDF算法和/或预设TextRank-IDF算法，计算每个所述单词在所述文本内容中的TF-IDF权重值和/或TextRank-IDF权重值；
将TF-IDF权重值大于第一阈值和/或TextRank-IDF权重值大于第二阈值的单词作为所述关键词。

4.如权利要求3所述的视频内容的拓展方法，其特征在于，所述预设TF-IDF算法的计算公式为

；

表示单词i在所述文本内容中的TF-IDF权重值，表示单词i的词频，表示单词i的逆文档词频，表示单词i的词长权重值，表示单词i在所述文本内容中出现的次数，表示所述文本内容中所有单词的数目，表示预设语料库中所有文档数，表示所述预设预料库中包含单词i的文档数，表示单词i的词语长度，表示所述文本内容中的最长词的词语长度。

5.如权利要求3所述的视频内容的拓展方法，其特征在于，所述预设TextRank-IDF算法的计算公式为

；

表示单词i在所述文本内容中的TextRank-IDF权重值，d表示阻尼系数，表示指向单词j的词集合，表示单词i属于词集合，表示单词j指向的单词集合，表示单词k属于单词集合，表示将单词i与单词j作为两点时两点之间边的权重，表示将单词j与单词k作为两点时两点之间边的权重，表示单词j的在所述文本内容中的TextRank权重值，表示单词i的逆文档词频。

6.如权利要求2所述的视频内容的拓展方法，其特征在于，所述基于多个所述关键词，确定所述文本内容的所述待拓展词，包括：
基于每个所述关键词在所述文本内容中的TF-IDF权重值和TextRank-IDF权重值，确定每个所述关键词在所述文本内容中的TID-Rank权重值，所述TID-Rank权重值为根据所述文本内容的长度对所述关键词的权重进行重新分配的结果；
根据所述TID-Rank权重值，对多个所述关键词进行排序，得到排列顺序；
将在所述排列顺序中的前N个或后N个所述关键词作为所述文本内容的所述待拓展词，N为预设数量。

7.如权利要求6所述的视频内容的拓展方法，其特征在于，所述基于每个所述关键词在所述文本内容中的TF-IDF权重值和TextRank-IDF权重值，确定每个所述关键词在所述文本内容中的TID-Rank权重值，包括：
根据所述文本内容的文本长度，确定所述TF-IDF权重值和所述TextRank-IDF权重值的置信度系数；
基于所述置信度系数、所述TF-IDF权重值和TextRank-IDF权重值，根据预设TID-Rank算法计算所述关键词在所述文本内容中的TID-Rank权重值。

8.如权利要求7所述的视频内容的拓展方法，其特征在于，所述预设TID-Rank算法的计算公式为

；

表示关键词i在所述文本内容中的TID-Rank权重值，表示增加词性权重后的关键词i在所述文本内容中的TF-IDF权重值，，表示关键词i的词性权重，表示关键词i在所述文本内容中的TF-IDF权重值，表示增加词性权重后的关键词i在所述文本内容中的TextRank...

【专利技术属性】
技术研发人员：周凡，
申请(专利权)人：中山大学深圳研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人