基于人工智能的新闻采访稿自动生成方法及相关设备技术

技术编号:21550151 阅读:42 留言:0更新日期:2019-07-06 22:49
本申请涉及人工智能领域,本申请公开了一种基于人工智能的新闻采访稿自动生成方法及相关设备,所述方法包括:构建语音识别模型、声纹识别模型及人脸识别模型,并通过所述语音识别模型、声纹识别模型及人脸识别模型获取新闻采访人物信息、时间信息及新闻采访文字信息,并根据所述新闻采访人物信息、时间信息及新闻采访文字信息自动转换成新闻采访稿。本申请通过声纹识别以及人脸识别确认说话人物,并通过语音识别将所述人物的谈话内容转换成文字,与人物对应后形成采访稿,可以有效的缩短写稿时间,提升发稿速度。

Automatic Generation of News Acquisition Papers Based on Artificial Intelligence and Related Equipment

【技术实现步骤摘要】
基于人工智能的新闻采访稿自动生成方法及相关设备
本申请涉及人工智能领域,特别涉及一种基于人工智能的新闻采访稿自动生成方法及相关设备。
技术介绍
通常记者采访需要写采访稿件,需要对采访的录音进行反复听写才能写出同期声稿件。现有的语音识别产品可以解决录音转写成文字的功能,但是无法准确的定位到视频中的某人说了那些话,这样记者同样人工去需要去区分哪些人说了哪些话,识别的结果是逐句逐字识别的结果,记者也同样需要对识别的结果进行提炼和整理,耗时耗力。
技术实现思路
本申请的目的在于针对现有技术的不足,提供一种基于人工智能的新闻采访稿自动生成方法及相关设备,通过声纹识别以及人脸识别确认说话人物,并通过语音识别将所述人物的谈话内容转换成文字,与人物对应后形成采访稿,可以有效的缩短写稿时间,提升发稿速度。为达到上述目的,本申请的技术方案提供一种基于人工智能的新闻采访稿自动生成方法及相关设备。本申请公开了一种基于人工智能的新闻采访稿自动生成方法,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。较佳地,所述将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述语音识别模型,获得关键帧及新闻采访文字;将所述关键帧与所述新闻采访文字进行逐一对应。较佳地,所述将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述声纹识别模型,获得关键帧及人物信息,所述声纹识别模型包含多个人物信息的声纹库;将所述关键帧与所述人物信息进行逐一对应。较佳地,所述将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧,包括:将所述视频文件输入所述人脸识别模型,获得关键帧及人物信息,所述人脸识别模型包含多个人物信息的人脸库;将所述关键帧与所述人物信息进行逐一对应。较佳地,所述根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,包括:在所述第二时间信息和所述第三时间信息中查询相同的关键帧;将所述第二时间信息中相同关键帧对应的第一人物信息与所述第三时间信息中相同关键帧对应的第二人物信息进行比对,获得新闻采访人物信息,所述新闻采访人物信息包含关键帧及与所述关键帧对应的新闻采访人物。较佳地,所述根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿,包括:根据所述第一时间信息获取关键帧,并根据所述关键帧在所述新闻采访人物信息中查询;当在所述新闻采访人物信息中查询到与所述第一时间信息中相同的关键帧后,获取所述相同关键帧对应的新闻采访人物;将所述新闻采访人物与所述相同关键帧及与所述相同关键帧对应的新闻采访文字进行对应,获得新闻采访稿。较佳地,所述根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿之后,包括:构建NLP自然语言处理模型,并将所述新闻采访稿输入所述NLP自然语言处理模型对所述新闻采访稿中的新闻采访文字进行语义提炼,获得提炼新闻采访稿。本申请还公开了一种基于人工智能的新闻采访稿自动生成装置,所述装置包括:模型构建模块:设置为构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;第一信息获取模块:设置为将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;第二信息获取模块:设置为将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;第三信息获取模块:设置为将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;稿件生成模块:设置为根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。本申请还公开了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述所述新闻采访稿自动生成方法的步骤。本申请还公开了一种存储介质,所述存储介质可被处理器读写,所述存储介质存储有计算机指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述新闻采访稿自动生成方法的步骤。本申请的有益效果是:本申请通过声纹识别以及人脸识别确认说话人物,并通过语音识别将所述人物的谈话内容转换成文字,与人物对应后形成采访稿,可以有效的缩短写稿时间,提升发稿速度。附图说明图1为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图2为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图3为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图4为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图5为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图6为本申请实施例的一种基于人工智能的新闻采访稿自动生成方法的流程示意图;图7为本申请实施例的一种基于人工智能的新闻采访稿自动生成装置结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。本申请实施例的一种基于人工智能的新闻采访稿自动生成方法流程如图1所示,本实施例包括以下步骤:步骤s101,构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;本文档来自技高网
...

【技术保护点】
1.一种基于人工智能的新闻采访稿自动生成方法,其特征在于,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。

【技术特征摘要】
1.一种基于人工智能的新闻采访稿自动生成方法,其特征在于,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。2.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述语音识别模型,获得关键帧及新闻采访文字;将所述关键帧与所述新闻采访文字进行逐一对应。3.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述声纹识别模型,获得关键帧及人物信息,所述声纹识别模型包含多个人物信息的声纹库;将所述关键帧与所述人物信息进行逐一对应。4.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧,包括:将所述视频文件输入所述人脸识别模型,获得关键帧及人物信息,所述人脸识别模型包含多个人物信息的人脸库;将所述关键帧与所述人物信息进行逐一对应。5.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,包括:在所述第二时间信息和所述第三时间信息中查询相同的关键帧;将所述第二时间信息中相同关键帧对应的第一人物信息与所述第三时间信息中相同关键帧对应的第二人物信息进行比对,获得新闻采访人物信息,所述新闻采访人物信息包含关键帧及与所述关键帧对应的新闻采访人物。6....

【专利技术属性】
技术研发人员:朱胜强
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1