一种文本信息处理方法、系统、设备及计算机存储介质技术方案

技术编号:37345171 阅读:13 留言:0更新日期:2023-04-22 21:37
本申请公开了一种文本信息处理方法、系统、设备及计算机存储介质,涉及AIGC技术领域,获取待处理的目标文本信息;对目标文本信息进行分词处理,得到目标词语;基于目标词语解析目标文本信息所描述的内容类型;若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片;若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。本申请在内容类型为静态内容时,基于AIGC生成目标文本信息对应的目标图片,可以在内容类型为动态内容时,基于AIGC生成目标文本信息对应的目标视频,实现了自动应用AIGC来将目标文本信息转换为对应的目标图片或目标视频,提高了AIGC的自主处理能力。提高了AIGC的自主处理能力。提高了AIGC的自主处理能力。

【技术实现步骤摘要】
一种文本信息处理方法、系统、设备及计算机存储介质


[0001]本申请涉及AI

Generated Content(AIGC,人工智能生成的内容)
,更具体地说,涉及一种文本信息处理方法、系统、设备及计算机存储介质。

技术介绍

[0002]随着人工智能理论和技术的发展,利用AIGC能够在短时间内生成画作,比如为文本类的数字作品(新闻、诗词、小说、文案、论文、专利等)配上生动的图片、视频,可以让作品描述更加生动。
[0003]然而,现有的AIGC中,是由用户自己决定将一个文本转换成图片还是视频的,也即当用户决定将文本转换成图片时,应用AIGC中的文本生成图像模型来生成文本对应的图片,当用户决定将文本转换成视频时,应用AIGC中的文本生成视频模型来生成文本对应的视频,使得现有AIGC的应用离不开用户的操作,需要依赖用户,自主处理能力差。
[0004]综上所述,如何提高AIGC的自主处理能力是目前本领域技术人员亟待解决的问题。

技术实现思路

[0005]本申请的目的是提供一种文本信息处理方法,其能在一定程度上解决如何提高AIGC技术的自主处理能力的技术问题。本申请还提供了一种文本信息处理系统、设备及计算机可读存储介质。
[0006]为了实现上述目的,本申请提供如下技术方案:一种文本信息处理方法,包括:获取待处理的目标文本信息;对所述目标文本信息进行分词处理,得到目标词语;基于所述目标词语解析所述目标文本信息所描述的内容类型;若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。
[0007]在一些实施例中,所述基于所述目标词语解析所述目标文本信息所描述的内容类型,包括:预测所述目标词语属于目标词典库中各个已知词语的概率值;基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型;其中,所述目标词性包括所述静态内容对应的所述已知词语或所述动态内容对应的所述已知词语。
[0008]在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标
文本信息所描述的所述内容类型,包括:将所述静态内容对应的所述已知词语的所述概率值相加,得到第一概率值;将所述动态内容对应的所述已知词语的所述概率值相加,得到第二概率值;若所述第一概率值大于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述第一概率值小于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
[0009]在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;确定所述选定词语中属于所述静态内容对应的所述已知词语的第一数量值;确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;计算所述第一数量值与所述第二数量值间的差值;若所述差值大于第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述差值小于所述第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
[0010]在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;若所述第二数量值小于第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述第二数量值大于所述第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
[0011]在一些实施例中,所述预测所述目标词语属于目标词典库中各个已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:将所述目标词语输入预先训练好的语言神经网络模型;获取所述语言神经网络模型输出的所述内容类型;其中,所述语言神经网络模型用于:预测所述目标词语属于目标词典库中各个所述已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型。
[0012]在一些实施例中,所述语言神经网络模型的类型包括提示学习模型。
[0013]在一些实施例中,所述获取待处理的目标文本信息,包括:获取待处理的初始文本信息;对所述初始文本信息进行翻译,得到翻译文本信息;
基于所述翻译文本信息得到所述目标文本信息。
[0014]在一些实施例中,所述基于所述翻译文本信息得到所述目标文本信息,包括:对所述翻译文本信息进行扩展,得到所述目标文本信息。
[0015]在一些实施例中,所述对所述翻译文本信息进行扩展,得到所述目标文本信息,包括:提取所述翻译文本信息中的目标关键词;在预设的内容扩展描述知识库中选取出与所述目标关键词相似的目标描述语;基于所述目标描述语与所述翻译文本信息生成所述目标文本信息。
[0016]在一些实施例中,所述基于所述目标描述语与所述翻译文本信息生成所述目标文本信息,包括:在预设的画质经验限定词中选取出与所述目标关键词对应的目标限定词;基于所述目标描述语、所述目标限定词及所述翻译文本信息生成所述目标文本信息。
[0017]在一些实施例中,所述获取待处理的目标文本信息,包括:获取待处理的初始文本信息;对所述初始文本信息进行拆分,得到拆分文本信息;基于所述拆分文本信息得到所述目标文本信息。
[0018]在一些实施例中,所述对所述初始文本信息进行拆分,得到拆分文本信息,包括:基于自然语言处理算法对所述初始文本信息进行等长拆分,得到所述拆分文本信息。
[0019]在一些实施例中,所述基于所述拆分文本信息得到所述目标文本信息,包括:对于每个所述拆分文本信息,生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,计算各个所述段落语义向量与所述总语义向量的相似度值,将目标数量个值最大的所述相似度值对应的所述文本段落确定为目标文本段落;基于所述目标文本段落生成所述目标文本信息。
[0020]在一些实施例中,所述计算各个所述段落语义向量与所述总语义向量的相似度值,包括:基于余弦相似度法计算各个所述段落语义向量与所述总语义向量的所述相似度值。
[0021]在一些实施例中,所述基于所述目标文本段落生成所述目标文本信息,包括:提取所述目标文本段落中的目标语句;将所述目标语句作为所述目标文本信息。
[0022]在一些实施例中,所述生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,包括:通过Sentence

BERT模型生成所述拆分文本信息的所述总语义向量,生成所述拆分文本信息中各个所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本信息处理方法,其特征在于,包括:获取待处理的目标文本信息;对所述目标文本信息进行分词处理,得到目标词语;基于所述目标词语解析所述目标文本信息所描述的内容类型;若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。2.根据权利要求1所述的文本信息处理方法,其特征在于,所述基于所述目标词语解析所述目标文本信息所描述的内容类型,包括:预测所述目标词语属于目标词典库中各个已知词语的概率值;基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型;其中,所述目标词性包括所述静态内容对应的所述已知词语或所述动态内容对应的所述已知词语。3.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:将所述静态内容对应的所述已知词语的所述概率值相加,得到第一概率值;将所述动态内容对应的所述已知词语的所述概率值相加,得到第二概率值;若所述第一概率值大于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述第一概率值小于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。4.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;确定所述选定词语中属于所述静态内容对应的所述已知词语的第一数量值;确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;计算所述第一数量值与所述第二数量值间的差值;若所述差值大于第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述差值小于所述第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。5.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;
若所述第二数量值小于第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;若所述第二数量值大于所述第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。6.根据权利要求2所述的文本信息处理方法,其特征在于,所述预测所述目标词语属于目标词典库中各个已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:将所述目标词语输入预先训练好的语言神经网络模型;获取所述语言神经网络模型输出的所述内容类型;其中,所述语言神经网络模型用于:预测所述目标词语属于目标词典库中各个所述已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型。7.根据权利要求6所述的文本信息处理方法,其特征在于,所述语言神经网络模型的类型包括提示学习模型。8.根据权利要求1所述的文本信息处理方法,其特征在于,所述获取待处理的目标文本信息,包括:获取待处理的初始文本信息;对所述初始文本信息进行翻译,得到翻译文本信息;基于所述翻...

【专利技术属性】
技术研发人员:朱洪银林群阳张闯王敏
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1