【技术实现步骤摘要】
基于人工智能的新闻采访稿自动生成方法及相关设备
本申请涉及人工智能领域,特别涉及一种基于人工智能的新闻采访稿自动生成方法及相关设备。
技术介绍
通常记者采访需要写采访稿件,需要对采访的录音进行反复听写才能写出同期声稿件。现有的语音识别产品可以解决录音转写成文字的功能,但是无法准确的定位到视频中的某人说了那些话,这样记者同样人工去需要去区分哪些人说了哪些话,识别的结果是逐句逐字识别的结果,记者也同样需要对识别的结果进行提炼和整理,耗时耗力。
技术实现思路
本申请的目的在于针对现有技术的不足,提供一种基于人工智能的新闻采访稿自动生成方法及相关设备,通过声纹识别以及人脸识别确认说话人物,并通过语音识别将所述人物的谈话内容转换成文字,与人物对应后形成采访稿,可以有效的缩短写稿时间,提升发稿速度。为达到上述目的,本申请的技术方案提供一种基于人工智能的新闻采访稿自动生成方法及相关设备。本申请公开了一种基于人工智能的新闻采访稿自动生成方法,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息 ...
【技术保护点】
1.一种基于人工智能的新闻采访稿自动生成方法,其特征在于,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。
【技术特征摘要】
1.一种基于人工智能的新闻采访稿自动生成方法,其特征在于,包括以下步骤:构建语音识别模型、声纹识别模型及人脸识别模型,获取新闻采访视频,并将所述新闻采访视频根据语音识别模型、声纹识别模型及人脸识别模型的文件格式和码率进行转换,获得音频文件和视频文件;将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧;将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧;将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧;根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,并根据所述新闻采访人物信息、新闻采访文字及第一时间信息获得新闻采访稿。2.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述音频文件输入所述语音识别模型,获得第一时间信息及新闻采访文字,所述第一时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述语音识别模型,获得关键帧及新闻采访文字;将所述关键帧与所述新闻采访文字进行逐一对应。3.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述音频文件输入所述声纹识别模型,获得第二时间信息及第一人物信息,所述第二时间信息包含一个或多个关键帧,包括:将所述音频文件输入所述声纹识别模型,获得关键帧及人物信息,所述声纹识别模型包含多个人物信息的声纹库;将所述关键帧与所述人物信息进行逐一对应。4.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述将所述视频文件输入所述人脸识别模型,获得第三时间信息及第二人物信息,所述第三时间信息包含一个或多个关键帧,包括:将所述视频文件输入所述人脸识别模型,获得关键帧及人物信息,所述人脸识别模型包含多个人物信息的人脸库;将所述关键帧与所述人物信息进行逐一对应。5.如权利要求1所述的基于人工智能的新闻采访稿自动生成方法,其特征在于,所述根据所述第二时间信息、第三时间信息、第一人物信息及第二人物信息,获得新闻采访人物信息,包括:在所述第二时间信息和所述第三时间信息中查询相同的关键帧;将所述第二时间信息中相同关键帧对应的第一人物信息与所述第三时间信息中相同关键帧对应的第二人物信息进行比对,获得新闻采访人物信息,所述新闻采访人物信息包含关键帧及与所述关键帧对应的新闻采访人物。6....
【专利技术属性】
技术研发人员:朱胜强,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。