文本增量方法、装置及终端设备制造方法及图纸

技术编号:24411027 阅读:28 留言:0更新日期:2020-06-06 09:12
本申请适用于自然语言处理技术领域,提供了一种文本增量方法,包括:获取待增量文本;对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;确定所述待增量文本的文本主题;将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。本申请提高了增量文本与待增量文本的相关度,从而大大提高了生成文本的准确度。

Text increment method, device and terminal equipment

【技术实现步骤摘要】
文本增量方法、装置及终端设备
本申请属于自然语言处理
,尤其涉及一种文本增量方法、装置、终端设备及计算机可读存储介质。
技术介绍
当前,在诸如问答系统、机器翻译等很多人工智能领域,都有根据原始文本数据生成其他文本数据的需求。例如人机问答系统中,当用户询问机器人时,机器人的回答需与用户的问题相关,也就是说,要求机器人生成的回答文本数据与用户询问的文本数据之间相关联。但是传统的文本生成模型面临的挑战是,生成的文本随机性过强,因此,亟需提供一种新的文本增量方案。
技术实现思路
本申请实施例提供了一种文本增量方法、装置、终端设备及计算机可读存储介质,提供了一种新的文本增量方案,提高了增量文本与待增量文本的相关度。第一方面,本申请实施例提供了一种文本增量方法,包括:获取待增量文本;对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;确定所述待增量文本的文本主题;将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。第二方面,本申请实施本文档来自技高网...

【技术保护点】
1.一种文本增量方法,其特征在于,包括:/n获取待增量文本;/n对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;/n确定所述待增量文本的文本主题;/n将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。/n

【技术特征摘要】
1.一种文本增量方法,其特征在于,包括:
获取待增量文本;
对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;
确定所述待增量文本的文本主题;
将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。


2.如权利要求1所述的文本增量方法,其特征在于,对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵,包括:
通过预设的词向量模型将所述待增量文本转换成特征矩阵。


3.如权利要求2所述的文本增量方法,其特征在于,所述通过预设的词向量模型将所述待增量文本转换成特征矩阵,包括:
通过预设的BERT模型对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵。


4.如权利要求3所述的文本增量方法,其特征在于,所述通过预设的BERT模型对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵,包括:
通过预设的BERT模型将所述待增量文本转换为N×768维的特征矩阵,预设的所述BERT模型包括24层编码层;其中,所述待增量文本包括N个字符,N为正整数。


5.如权利要求2所述的文本增量方法,其特征在于,通过预设的词向量模型将所述待增量文本转换成特征矩阵,包括:
获取所述待增量文本的关键词;
获取每个所述关键词对应的特征向量;
将所有所述关键词对应的所述特征向量进行组合,生成特征矩阵。

【专利技术属性】
技术研发人员:王健宗于凤英程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1