虚拟数字人自动化写作方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38772298 阅读:15 留言:0更新日期:2023-09-10 10:45
本发明专利技术实施例公开了虚拟数字人自动化写作方法、装置、计算机设备及存储介质。所述方法包括:采集并整理金融资讯素材;对所述金融资讯素材进行语义结构化处理,以得到结构化数据;对所述结构化数据进行分析,以确定自动化写作选题;根据所述自动化写作选题生成自动化写作文本。通过实施本发明专利技术实施例的方法可实现根据金融业务素材和金融资讯新闻进行自动化的主播解说选题规划及内容创作,生成符合行业规范的解说文本。规范的解说文本。规范的解说文本。

【技术实现步骤摘要】
虚拟数字人自动化写作方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能,更具体地说是指虚拟数字人自动化写作方法、装置、计算机设备及存储介质。

技术介绍

[0002]在金融领域,目前的虚拟数字人得到越来越多的场景运用,例如进行虚拟主播等,而目前大多数虚拟数字人的解说内容都是提前人工准备的,并不能根据实际情况进行自动化写作,更加无法根据金融业务素材和金融资讯新闻进行自动化的主播解说选题规划及内容创作,容易导致生成的解说文本不符合行业规范。
[0003]因此,有必要设计一种新的方法,实现根据金融业务素材和金融资讯新闻进行自动化的主播解说选题规划及内容创作,生成符合行业规范的解说文本。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺陷,提供虚拟数字人自动化写作方法、装置、计算机设备及存储介质。
[0005]为实现上述目的,本专利技术采用以下技术方案:虚拟数字人自动化写作方法,包括:采集并整理金融资讯素材;对所述金融资讯素材进行语义结构化处理,以得到结构化数据;对所述结构化数据进行分析,以确定自动化写作选题;根据所述自动化写作选题生成自动化写作文本。
[0006]其进一步技术方案为:所述对所述金融资讯素材进行语义结构化处理,以得到结构化数据,包括:对所述金融资讯素材进行文本分词与实体识别,以得到识别结果;对所述识别结果进行分类,以得到分类结果;对所述分类结果进行关系结构化抽取,以得到结构化数据。
[0007]其进一步技术方案为:所述对所述金融资讯素材进行文本分词与实体识别,以得到识别结果,包括:采用预训练的深度模型与CFR相结合的方式以及结合BI序列标签体系对所述金融资讯素材进行文本分词与实体识别,以得到识别结果。
[0008]其进一步技术方案为:所述对所述识别结果进行分类,以得到分类结果,包括:采用以Transformer为基础结构的BERT预训练模型对所述识别结果进行分类,以得到分类结果。
[0009]其进一步技术方案为:所述对所述分类结果进行关系结构化抽取,以得到结构化数据,包括:使用触发词与匹配模板结合的方式对所述分类结果进行关系结构化抽取,以得到第一抽取结果;
采用事件和关系抽取处理模型对无法抽取的所述分类结果进行关系结构化抽取,以得到第二抽取结果;整合所述第一抽取结果以及第二抽取结果,以得到结构化数据。
[0010]其进一步技术方案为:所述对所述结构化数据进行分析,以确定自动化写作选题,包括:对所述结构化数据内的事件按关键要素进行事件聚合,以得到聚合结果;确定所述聚合结果内的当前主体或时间的热点事件;分析所述热点事件的传导链路;根据所述传导链路整合选题要素,以确定自动化写作选题。
[0011]其进一步技术方案为:所述根据所述自动化写作选题生成自动化写作文本,包括:对所述自动化写作选题提取文本摘要;查询并填充当前主体行情或指标走势的可视化图表;生成所述热点事件对传导链路关联逻辑的文本摘要,以得到目标文本摘要;根据所述可视化图表以及所述目标文本摘要生成自动化写作文本。
[0012]本专利技术还提供了虚拟数字人自动化写作装置,包括:采集单元,用于采集并整理金融资讯素材;处理单元,用于对所述金融资讯素材进行语义结构化处理,以得到结构化数据;分析单元,用于对所述结构化数据进行分析,以确定自动化写作选题;文本生成单元,用于根据所述自动化写作选题生成自动化写作文本。
[0013]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0014]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0015]本专利技术与现有技术相比的有益效果是:本专利技术通过对采集并整理的金融资讯素材进行语义结构化处理,形成结构化数据,并对该数据进行分析,以确定自动化写作选题,以该选题生成自动化写作文本,实现根据金融业务素材和金融资讯新闻进行自动化的主播解说选题规划及内容创作,生成符合行业规范的解说文本。
[0016]下面结合附图和具体实施例对本专利技术作进一步描述。
附图说明
[0017]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术实施例提供的虚拟数字人自动化写作方法的应用场景示意图;图2为本专利技术实施例提供的虚拟数字人自动化写作方法的流程示意图;图3为本专利技术实施例提供的虚拟数字人自动化写作方法的子流程示意图;图4为本专利技术实施例提供的虚拟数字人自动化写作方法的子流程示意图;图5为本专利技术实施例提供的虚拟数字人自动化写作方法的子流程示意图;图6为本专利技术实施例提供的虚拟数字人自动化写作方法的子流程示意图;
图7为本专利技术实施例提供的分词与实体识别的算法模型示意图;图8为本专利技术实施例提供的BERT模型结构示意图;图9为本专利技术实施例提供的事件和关系抽取处理模型结构示意图;图10为本专利技术实施例提供的虚拟数字人自动化写作装置的示意性框图;图11为本专利技术实施例提供的虚拟数字人自动化写作装置的处理单元的示意性框图;图12为本专利技术实施例提供的虚拟数字人自动化写作装置的抽取子单元的示意性框图;图13为本专利技术实施例提供的虚拟数字人自动化写作装置的分析单元的示意性框图;图14为本专利技术实施例提供的计算机设备的示意性框图。
实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0021]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0022]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0023]请参阅图1和图2,图1为本专利技术实施例提供的虚拟数字人自动化写作方法的应用场景示意图。图2为本专利技术实施例提供的虚拟数字人自动化写作方法的示意性流程图。该虚拟数字人自动化写作方法应用于服务器中。该服务器与终端进行数据交互,通过获取终端输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.虚拟数字人自动化写作方法,其特征在于,包括:采集并整理金融资讯素材;对所述金融资讯素材进行语义结构化处理,以得到结构化数据;对所述结构化数据进行分析,以确定自动化写作选题;根据所述自动化写作选题生成自动化写作文本。2.根据权利要求1所述的虚拟数字人自动化写作方法,其特征在于,所述对所述金融资讯素材进行语义结构化处理,以得到结构化数据,包括:对所述金融资讯素材进行文本分词与实体识别,以得到识别结果;对所述识别结果进行分类,以得到分类结果;对所述分类结果进行关系结构化抽取,以得到结构化数据。3.根据权利要求2所述的虚拟数字人自动化写作方法,其特征在于,所述对所述金融资讯素材进行文本分词与实体识别,以得到识别结果,包括:采用预训练的深度模型与CFR相结合的方式以及结合BI序列标签体系对所述金融资讯素材进行文本分词与实体识别,以得到识别结果。4.根据权利要求2所述的虚拟数字人自动化写作方法,其特征在于,所述对所述识别结果进行分类,以得到分类结果,包括:采用以Transformer为基础结构的BERT预训练模型对所述识别结果进行分类,以得到分类结果。5.根据权利要求1所述的虚拟数字人自动化写作方法,其特征在于,所述对所述分类结果进行关系结构化抽取,以得到结构化数据,包括:使用触发词与匹配模板结合的方式对所述分类结果进行关系结构化抽取,以得到第一抽取结果;采用事件和关系抽取处理模型对无法抽取的所述分类结果进行关系结构化抽取,以得到第二抽取结果;整合所述第一抽...

【专利技术属性】
技术研发人员:高鹏康维鹏袁兰吴飞周伟华高峰潘晶
申请(专利权)人:杭州摸象大数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1