【技术实现步骤摘要】
一种智能会议纪要生成方法和系统
本专利技术涉及人工智能自然语言处理的
,尤其涉及一种智能会议纪要生成方法和系统。
技术介绍
近年来在日常办公过程当中,每个工作日几乎都可能会面临各项会议,而在参会过程中,参会成员一般专注于跟进会议内容、进程,在会议结束后,会议纪要往往需要依靠专门的工作人员根据参会过程进行收集整理,纪要人需要跟进会议上所有人的反馈做记录并会下整理、转发,甚至需要跟进,从而导致整理会议纪要的过程需要人力成本的投入,耗费人力又费时。目前,会议纪要整理通常是通过纪要人员手记录,虽然有少部分使用了语音识别技术,由机器识别发言人的语音并转换为文字记录。但是,机器只能单纯实现从语音到文字上的转换,并不能够对会议内容进行理解和整理。会议纪要是用于记录会议要点、以便于存档和传递会议信息的重要手段,随着信息时代的到来,会议纪要被越来越多的企业重视。比较传统的实现会议纪要的方式就是安排书记员进行会议过程的记录,比较依赖于书记员的专注力,书记员开小差会出现漏记的现象。随着科技的发展,涌现出了录音笔、拾音器等产品帮助记录 ...
【技术保护点】
1.一种智能会议纪要生成方法,其特征在于:包括以下步骤,/n获取会议音、视频信号;/n提取实时语音信号的声纹特征,并在预设声纹数据库中检索该声纹特征,若检索不到,则将改声纹特征添加到数据库中并添加身份ID;/n所述声纹特征与预设声纹数据库进行特征匹配,识别出不同语音信号所对应的发言人身份,将不同发言人的发言语音分离;/n将分离后的语音信号分别转写为文字,并生成与发言者对应的初步文本;/n对所述初步文本进行纠错、优化处理为目标文本;/n抽取所述目标文本内的重要句子组成摘要,并按照预设的模板整理成所述会议纪要。/n
【技术特征摘要】
1.一种智能会议纪要生成方法,其特征在于:包括以下步骤,
获取会议音、视频信号;
提取实时语音信号的声纹特征,并在预设声纹数据库中检索该声纹特征,若检索不到,则将改声纹特征添加到数据库中并添加身份ID;
所述声纹特征与预设声纹数据库进行特征匹配,识别出不同语音信号所对应的发言人身份,将不同发言人的发言语音分离;
将分离后的语音信号分别转写为文字,并生成与发言者对应的初步文本;
对所述初步文本进行纠错、优化处理为目标文本;
抽取所述目标文本内的重要句子组成摘要,并按照预设的模板整理成所述会议纪要。
2.如权利要求1所述的智能会议纪要生成方法,其特征在于:还包括以下步骤,
实时视频记录开会时的现场环境;
所述音、视频信号均保存在后端,通过时间戳进行会后访问;
将整理的所述会议纪要和/或目标文本通过邮件、微信或传真推送给与会人员以及其他相关人员;
向指定用户提供以网页显示方式浏览所述会议纪要和/或所述目标文本;
将所述会议纪要和/或所述目标文本与视频信号中的图像组合。
3.如权利要求1或2所述的智能会议纪要生成方法,其特征在于:所述初步文本包括如下纠错步骤,
使用序列标注的思想进行错误字词的检测,并将检测结果标记为错误点,序列标注的模型结构为BiLSTM+CRF;
使用bigram统计语言模型对纠错候选空间进行筛选,生成搜索空间更小的纠错候选词集;
使用神经网络语言模型对替换纠错候选词集后的句子打分,根据分数选择正确的句子。
4.如权利要求3所述的智能会议纪要生成方法,其特征在于:包括纠错算法流程步骤,
错误检测:使用序列标注的思想检测文本中的错误字词,并将检测结果标记为错误点,其中序列标注模型结构为BiLSTM+CRF,模型训练语料为标注的语音转录文本及对正确进行同音字词、近音字词替换后的文本;
纠错候选集生成:根据所述错误检测的结果,在每个错误点生成由其同音、近音字词组成的纠错候选空间,使用ppl计算速度更快的bigram统计语言模型对纠错候选空间进行筛选,每个错误点依次替换纠错候选空间的候选字词,使用bigram统计语言模型对替换后的句子计算ppl分值,每个错误点选择更合理的词组成对应的纠错候选集合,每个纠错候选集合的字词数量不超过k(常数)个;
错误纠正:根据所述错误检测的结果,在每个错误点生成对应的同音、同形字词候选集,依次替换后分别计算替换后句子的ppl,根据ppl将句子排序,选择ppl分数低的句子作为正确句子。
5.如权利要求1~2或4任一所述的智能会议纪要生成方法,其特征在于:所述初步文本的优化包括基于规则引擎的文本处理和利用BiLSTM做标点纠错;
其中所述针对初步文本存在大量的语气词、连续重复字词及短句、因转录产生的错误字词及标点,...
【专利技术属性】
技术研发人员:杨理想,王云甘,周亚,张侨,王银瑞,
申请(专利权)人:南京摄星智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。