一种会议纪要生成方法及装置制造方法及图纸

技术编号:31827573 阅读:7 留言:0更新日期:2022-01-12 12:58
本申请提供一种会议纪要生成方法及装置,其中所述会议纪要生成方法包括:对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;接收针对所述会议文本的会议属性信息;将所述会议属性信息和所述会议文本输入至会议纪要生成模型;通过所述会议纪要生成模型根据所述会议属性信息和所述会议文本生成会议纪要。本申请提供了自动化生成会议纪要的方法,提升了用户的工作效率。提升了用户的工作效率。提升了用户的工作效率。

【技术实现步骤摘要】
一种会议纪要生成方法及装置


[0001]本申请涉及计算机
,特别涉及一种会议纪要生成方法及装置、计算设备和计算机可读存储介质。

技术介绍

[0002]在公司的日常会议中,通常要对会议的内容进行记录,需要对与会人员发言的内容进行整理记录,生成会议纪要,目前,会议纪要的生成主要依靠用户自主撰写,通过人工记录的方式得到的会议纪要往往准确率较低,或者因为记录速度慢的原因导致部分内容遗漏,或者因为主观因素导致记录有偏差等等。
[0003]因此,如何减少人为因素导致的会议纪要准确率低的问题,就成为技术人员亟待解决的问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种会议纪要生成方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本申请实施例的第一方面,提供了一种会议纪要生成方法,包括:
[0006]对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;
[0007]接收针对所述会议文本的会议属性信息;
[0008]将所述会议属性信息和所述会议文本输入至会议纪要生成模型;
[0009]通过所述会议纪要生成模型根据所述会议属性信息和所述会议文本生成会议纪要。
[0010]根据本申请实施例的第二方面,提供了一种会议纪要生成装置,包括:
[0011]转写模块,被配置为对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;
[0012]接收模块,被配置为接收针对所述会议文本的会议属性信息;
[0013]模型输入模块,被配置为将所述会议属性信息和所述会议文本输入至会议纪要生成模型;
[0014]生成模块,被配置为通过所述会议纪要生成模型根据所述会议属性信息和所述会议文本生成会议纪要。
[0015]根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述会议纪要生成方法的步骤。
[0016]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述会议纪要生成方法的步骤。
[0017]根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机指令,该计算机
指令被芯片执行时实现所述会议纪要生成方法的步骤。
[0018]本申请实施例提供的会议纪要生成方法,包括对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;接收针对所述会议文本的会议属性信息;将所述会议属性信息和所述会议文本输入至会议纪要生成模型;通过所述会议纪要生成模型根据所述会议属性信息和所述会议文本生成会议纪要。通过本申请实施例提供的会议纪要方法,能够将会议音频中的口语转换为精简的书面语表达,再通过会议纪要生成模型在书面语表达中提取重点信息,组成更适合阅读的会议纪要,解决了口语化信息表达不规范,阅读效率低的问题,同时也解决了无法自动化智能生成会议纪要的问题,提升了用户的使用体验和工作效率。
附图说明
[0019]图1是本申请实施例提供的计算设备的结构框图;
[0020]图2是本申请实施例提供的会议纪要生成方法的流程图;
[0021]图3是本申请实施例提供的文本转换模型训练方法的流程图;
[0022]图4是本申请实施例提供的会议纪要生成方法的示意图;
[0023]图5是本申请实施例提供的会议纪要生成装置的结构示意图。
具体实施方式
[0024]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0025]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“响应于确定”。
[0027]首先,对本专利技术一个或多个实施例涉及的名词术语进行解释。
[0028]会议音频文件:记录会议内容的音频文件,如会议录音。
[0029]会议文本:会议音频文件对应的书面文本。
[0030]会议属性信息:与会议相关的属性信息,例如会议主题、重点发言人等等。
[0031]会议纪要:会议音频文件或会议文本对应的会议提纲,可以包括会议的要点、会议的结论、会议布置的任务等等。
[0032]会议纪要生成模型:一种基于T5模型训练的根据会议文本生成对应会议纪要文本的人工智能模型。
[0033]语音识别模型:语音识别(Automatic Speech Recognition)是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言,语音识别模型是一种将音频转换成对应文字的人工智能模型。
[0034]口语表达文本:与音频文件对应的表达文本,与音频中的内容一致,会有很多口语化的表达,口语表达文本会比较繁琐,不够简洁。
[0035]口语表达句子集合:口语表达文本经过分句处理之后,生成的多个口语表达句子的集合。
[0036]文本转换模型:一种基于T5的预训练模型,可以将口语表达文本转换为书面语表达文本,书面语表达文本相比于口语表达文本更简洁、清楚。
[0037]T5:Text

To

Text Transfer Transformer,是一种Encoder

Decoder架构预训练模型。
[0038]书面语表达句子集合:将口语表达句子集合中的每个口语表达句子进行书面化转化后生成的多个书面语表达句子的集合。
[0039]待输入会议文本:由会议文本和会议属性信息拼接生成的文本,待输入会议文本输入至会议纪要生成模型后会生成对应的会议纪要。
[0040]在本申请中,提供了一种会议纪要生成方法及装置、计算设备和计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0041]图1示出了根据本申请一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会议纪要生成方法,其特征在于,包括:对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本;接收针对所述会议文本的会议属性信息;将所述会议属性信息和所述会议文本输入至会议纪要生成模型;通过所述会议纪要生成模型根据所述会议属性信息和所述会议文本生成会议纪要。2.如权利要求1所述的会议纪要生成方法,其特征在于,对接收到的会议音频文件进行文本转写,获得所述会议音频文件对应的会议文本,包括:将接收到的会议音频文件输入至语音识别模型,获得所述语音识别模型输出的口语表达文本;对所述口语表达文本进行处理,获得所述口语表达文本对应的会议文本。3.如权利要求2所述的会议纪要生成方法,其特征在于,对所述口语表达文本进行处理,获得所述口语表达文本对应的会议文本,包括:将所述口语表达文本进行分句处理,获得所述口语表达文本对应的口语表达句子集合;将所述口语表达句子集合中的口语表达句子输入至文本转换模型,获得所述口语表达句子集合对应的书面语表达句子集合;根据所述书面语表达句子集合获得会议文本。4.如权利要求3所述的会议纪要生成方法,其特征在于,所述文本转换模型通过下述步骤训练获得:获取样本口语表达句子和所述样本口语表达句子对应的样本书面语表达句子;将所述样本口语表达句子输入至待训练文本转换模型进行处理,获得所述待训练文本转换模型输出的预测书面语表达句子;根据所述预测书面语表达句子和所述样本书面语表达句子计算文本转换损失值;根据所述文本转换损失值调整所述待训练文本转换模型的模型参数,并继续训练所述待训练文本转换模型直至达到训练停止条件,获得训练好的文本转换模型。5.如权利要求1所述的会议纪要生成方法,其特征在于,接收针对所述会议文本的会议属性信息,包括:获取会议纪要模板,并将所述会议纪要模板和所述会议文本发送给用户;接收所述用户基于所述会议纪要模板输入的所述会议文本的会议属性信息。6.如权利要求1所述的会议...

【专利技术属性】
技术研发人员:吴伟彤李长亮李小龙
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1