对数据源生成语义描述的方法、设备和电子设备技术

技术编号：24517733 阅读：17 留言：0更新日期：2020-06-17 06:50

公开了一种对数据源生成语义描述的方法、设备、电子设备和计算机可读存储介质。该方法包括：获取数据源的数据编码特征；从范例句集合中获取至少一个范例句，并且获取所述至少一个范例句的句法编码特征；以及基于所述数据编码特征和所述句法编码特征，生成所述语义描述。本公开的对数据源生成语义描述的方法可以生成由句法指导的语义描述，提高了用户的阅读体验。

全部详细技术资料下载

【技术实现步骤摘要】
对数据源生成语义描述的方法、设备和电子设备
本公开涉及人工智能领域，更具体地涉及一种对数据源生成语义描述的方法、设备、电子设备和计算机可读存储介质。
技术介绍
目前，网络上存在多种数据源，例如视频、音频、图片、长文本信息等等。用户可能期待能够浏览这些数据源的语义描述(例如电影简介、音乐评论、文本摘要等语义描述信息)来做出决定，例如决定自己是否要进一步观看该电影、购买唱片和阅读长文本等。已经存在对这些数据源自动生成的语义描述的方法。例如，就对视频来生成视频简介的方法而言，传统的语义描述生成方法包括提取视频的编码特征并将这些编码特征输入至长短时记忆网络中以自动生成视频简介。目前，已经能够在自动生成视频简介的过程中加入一些辅助信息(例如风格、情感)来生成用户更期待的看到的视频简介。但是，已有的对数据源生成语义描述的方法所生成的语义描述都忽略了语义描述内容的句法表达，从而使得语义描述信息的句法单一，不便于用户阅读。
技术实现思路
本公开的实施例提供了对数据源生成语义描述的方法、设备、电子设备和计算机可读存储介质。本公开的实施例提供了一种对数据源生成语义描述的方法，包括：获取数据源的数据编码特征；从范例句集合中获取至少一个范例句，并且获取所述至少一个范例句的句法编码特征；以及基于所述数据编码特征和所述句法编码特征，生成所述语义描述。本公开的实施例提供了一种输出视频的语义描述的方法，包括：输出描述所述视频的语义描述；其中，所述视频的语义描述与范例句集合中的至少一个范例句的句法形式一致。...

【技术保护点】
1.一种对数据源生成语义描述的方法，包括：/n获取数据源的数据编码特征；/n从范例句集合中获取至少一个范例句，并且获取所述至少一个范例句的句法编码特征；以及/n基于所述数据编码特征和所述句法编码特征，生成所述语义描述。/n

【技术特征摘要】
1.一种对数据源生成语义描述的方法，包括：
获取数据源的数据编码特征；
从范例句集合中获取至少一个范例句，并且获取所述至少一个范例句的句法编码特征；以及
基于所述数据编码特征和所述句法编码特征，生成所述语义描述。

2.如权利要求1所述的对数据源生成语义描述的方法，其中，所述生成语义描述还包括：
基于所述句法编码特征对所述数据编码特征进行调制并获取调制特征；
利用长短时记忆网络，基于所述调制特征，生成所述语义描述。

3.如权利要求2所述的对数据源生成语义描述的方法，其中，
所述调制特征包括调制输入特征、调制隐藏特征以及调制单元特征中的一项或多项，其中，利用所述句法编码特征对所述数据编码特征进行调制并获取调制特征还包括以下各项中的一项或多项：
基于所述数据编码特征和所述长短时记忆网络在前一时刻生成的语义描述词的词向量来获取输入特征，并且基于所述句法编码特征对所述输入特征进行调制，得到调制输入特征；
基于所述句法编码特征对所述长短时记忆网络在前一时刻的隐藏特征进行调制，得到调制隐藏特征；或者
基于所述句法编码特征对所述长短时记忆网络在当前时刻的单元特征进行调制，得到调制单元特征。

4.如权利要求3所述的生成数据源描述句子的方法，其中，基于所述数据编码特征和所述长短时记忆网络在前一时刻生成的语义描述词的词向量，生成输入特征还包括：
基于所述数据编码特征和长短时记忆网络在前一时刻生成的隐藏特征，获取用于当前时刻的语义特征；
基于所述用于当前时刻的语义特征和所述长短时记忆网络在前一时刻生成的语义描述词的词向量，生成所述输入特征。

5.如权利要求4所述的生成数据源描述句子的方法，还包括：
基于所述句法编码特征和所述长短时记忆网络在前一时刻的隐藏特征获取用于当前时刻的句法特征，
其中，基于所述句法编码特征对所述数据编码特征进行调制包括：基于所述当前时刻的句法特征对所述输入特征、所述前一时刻生成的隐藏特征或所述单元特征中的一项或多项进行调制。

6.如权利要求2所述的对数据源生成语义描述的方法，其中，所述生成语义描述还包括：
基于所述长短时记忆网络的当前时刻的隐藏状态和所述长短时记忆网络的生成权重，获取当前时刻的词概率分布；
基于所述当前时刻的词概率分布获取当前时刻的语义描述词；
将多个时刻的语义描述词组合成所述语义描述。

7.如权利要求1所述的对数据源生成语义描述的方法，其中，所述数据源是视频数据，所述获取数据源的数据编码特征还包括：
将所述视频数据的一个或多个视频帧转换为一个或多个视频帧特征；
将所述一个或多个视频帧特征转换为视频编码特征；以及
将所述视频编码特征作为所述数据...

【专利技术属性】
技术研发人员：袁艺天，马林，王景文，刘威，朱文武，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人