【技术实现步骤摘要】
一种纪要确定方法及其相关设备
[0001]本申请涉及自然语言处理
,尤其涉及一种纪要确定方法及其相关设备。
技术介绍
[0002]在一些应用场景(例如,会议、演讲等)中,有些参与者(例如,记录人)通常会记录一些简洁的信息点来概括发言人的发言内容(例如,内容提要、会议中产生的结论、或者需要跟进的重要事项等),以便这些参与者后续能够基于这些用户记录,编写纪要内容(例如,会议纪要、报告总结等)。
[0003]另外,为了更好地编写纪要内容,这些参与者通常需要重新听会议录制音频(或者,演讲录制音频),并在这些用户记录的基础上编写纪要内容。
[0004]然而,因这些参与者需要消耗大量的时间来重新听会议录制音频,如此导致纪要内容的确定过程需要消耗较长时间,从而导致纪要确定效率比较低。
技术实现思路
[0005]本申请实施例的主要目的在于提供一种纪要确定方法及其相关设备,能够提高纪要确定效率。
[0006]本申请实施例提供了一种纪要确定方法,所述方法包括:获取待使用用户记录和待使用记录文本;对所述待使用记录文本进行句子划分处理,得到至少一个待使用句子;将所述待使用用户记录与所述至少一个待使用句子进行语义匹配处理,得到待使用语义匹配结果;根据所述待使用用户记录和所述待使用语义匹配结果,确定待使用纪要内容。
[0007]本申请实施例还提供了一种纪要确定装置,包括:信息获取单元,用于获取待使用用户记录和待使用记录文本;文本划分单元,用于对所述待使用记录文本进行句子划分处理,得到至少一个 ...
【技术保护点】
【技术特征摘要】
1.一种纪要确定方法,其特征在于,所述方法包括:获取待使用用户记录和待使用记录文本;对所述待使用记录文本进行句子划分处理,得到至少一个待使用句子;将所述待使用用户记录与所述至少一个待使用句子进行语义匹配处理,得到待使用语义匹配结果;根据所述待使用用户记录和所述待使用语义匹配结果,确定待使用纪要内容。2.根据权利要求1所述的方法,其特征在于,所述将所述待使用用户记录与所述至少一个待使用句子进行语义匹配处理,得到待使用语义匹配结果,包括:根据所述至少一个待使用句子以及预设句子标识符,确定待使用匹配文本;将所述待使用用户记录以及所述待使用匹配文本输入所述语义匹配模型,得到所述语义匹配模型输出的匹配预测结果;根据所述匹配预测结果,确定所述待使用语义匹配结果。3.根据权利要求2所述的方法,其特征在于,所述语义匹配模型包括词编码模块、内容交互模块以及匹配预测模块;所述匹配预测结果的确定过程,包括:根据所述待使用用户记录、所述待使用匹配文本以及词编码模块,确定用户记录编码特征和至少一个句子编码特征;根据所述用户记录编码特征、所述至少一个句子编码特征、以及所述内容交互模块,得到至少一个内容交互特征;将所述至少一个内容交互特征输入所述匹配预测模块,得到所述匹配预测模块输出的所述匹配预测结果。4.根据权利要求3所述的方法,其特征在于,所述语义匹配模型还包括句编码模块;所述根据所述用户记录编码特征、所述至少一个句子编码特征、以及所述内容交互模块,得到至少一个内容交互特征,包括:将所述至少一个句子编码特征输入所述句编码模块,得到所述句编码模块输出的至少一个句子表征特征;根据所述用户记录编码特征、所述至少一个句子表征特征、以及所述内容交互模块,得到至少一个内容交互特征。5.根据权利要求4所述的方法,其特征在于,所述根据所述用户记录编码特征、所述至少一个句子表征特征、以及所述内容交互模块,得到至少一个内容交互特征,包括:将所述用户记录编码特征以及所述至少一个句子表征特征输入所述内容交互模块,得到所述内容交互模块输出的所述至少一个内容交互特征。6.根据权利要求4所述的方法,其特征在于,所述根据所述用户记录编码特征、所述至少一个句子表征特征、以及所述内容交互模块,得到至少一个内容交互特征,包括:根据所述用户记录编码特征与各所述句子表征特征之间的相似度表征数据,从所述至少一个句子表征特征中筛选出满足第一相似条件的至少一个待参考句子特征;将所述用户记录编码特征以及所述至少一个待参考句子特征输入所述内容交互模块,得到所述内容交互模块输出的所述至少一个内容交互特征。7.根据权利要求3所述的方法,其特征在于,所述根据所述用户记录编码特征、所述至
少一个句子编码特征、以及所述内容交互模块,得到至少一个内容交互特征,包括:根据所述用户记录编码特征与各所述句子编码特征之间的相似度表征数据,从所述至少一个句子编码特征中筛选出满足第二相似条件的至少一个待处理句子特征;将所述用户记录编码特征以及所述至少一个待处理句子特征输入所述内容交互模块,得到所述内容交互模块输出的所述至少一个内容交互特征。8.根据权利要求5
‑
7中任一项所述的方法,其特征在于,所述内容交互模块包括注意力层和融合层;当所述内容交互模块的输入数据包括所述用户记录编码特征以及至少一个待交互句子特征时,所述至少一个内容交互特征的确定过程,包括:将所述用户记录编码特征以及所述至少一个待交互句子特征输入所述注意力层,得到所述注意力层输出的用户记录表征特征;根据所述用户记录表征特征、所述至少一个待交互句子特征、以及所述融合层,确定所述至少一个内容交互特征。9.根据权利要求8所述的方法,其特征在于,所述待交互句子特征的个数为E;第e个内容交互特征的确定过程,包括:将所述用户记录表征特征与第e个待交互句子特征输入所述融合层,得到所述融合层输出的所述第e个内容交互特征;其中,e为正整数,e≤E,E为正整数。10.根据权利要求2所述的方法,其特征在于,所述根据所述匹配预测结果,确定所述待使用语义匹配结果,包括:根据待使用文本检索结果、以及所述匹配预测结果,确定所述待使用语义匹配结果;其中,所述待使用文本检索结果是根据预设检索算法、所述待使用用户记录以及所述至少一个待使用句子确定的。11.根据权利要求1所述的方法,其特征在于,所述至少一个待使用句子包括至少一个语义匹配句子,且所述待使用语义匹配结果包括所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分;所述根据所述待使用用户记录和所述待使用语义匹配结果,确定待使用纪要内容之前,所述方法还包括:根据所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分,从所述至少一个语义匹配句子中筛选出满足预设基准条件的至少一个基准句子;根据所述至少一个基准句子的文本位置、以及各所述语义匹配句子的文本位置,确定各所述语义匹配句子的距离惩罚得分;利用各所述语义匹配句子的距离惩罚得分,更新所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分。12.根据权利要求11所述的方法,其特征在于,所述语义匹配句子的个数为E;其中,E为正整数;第e个语义匹配句子的距离惩罚得分的确定过程,包括:根据各个基准句子的文本位置与所述第e个语义匹配句子的文本位置之间的距离,确定所述第e个语义匹配句子对应的距离集;对所述第e个语义匹配句子对应的距离集进行预设统计分析处理,得到所述第e个语义
匹配句子对应的待使用距离;根据所述第e个语义匹配句子对应的待使用距离,确定所述第e个语义匹配句子的距离惩罚得分。13.根据权利要求1所述的方法,其特征在于,所述至少一个待使用句子包括至少一个语义匹配句子,且所述待使用语义匹配结果包括所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分;所述根据所述待使用用户记录和所述待使用语义匹配结果,确定待使用纪要内容,包括:根据所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分,从所述至少一个语义匹配句子中筛选出满足第一匹配条件的至少一个目标句子;根据所述待使用用户记录和所述至少一个目标句子,确定待使用纪要内容。14.根据权利要求13所述的方法,其特征在于,所述根据所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分,从所述至少一个语义匹配句子中筛选出满足第一匹配条件的至少一个目标句子,包括:根据所述待使用用户记录与各所述语义匹配句子之间的语义匹配得分,从所述至少一个语义匹配句子中筛选出满足第二匹配条件的至少一个初选句子;根据所述待使用用户记录与各所述初选句子之间的语义匹配得分,从所述至少一个初选句子中筛选出满足第三匹配条件的至少一个目标句子。15.根据权利要求14所述的方法,其特征在于,所述方法还包括:根据各所述初选句子的非停用词个数,从所述至少一个初选句子中筛选出满足第四匹配条件的至少一个再选句子;所述根据所述待使用用户记录与各所述初选句子之间的语义匹配得分,从所述至少一个初选句子中筛选出满足第三匹配条件的至少一个目标句子,包括:根据所述待使用用户记录与各所述再选句子之间的语义匹配得分,从所述至少一个再选句子中筛选出满足所述第三匹配条件的至少一个目标句子。16.根据权利要求13
‑
15中任一项所述的方法,其特征在于,所述至少一个目标句子的确定过程包括:根据所述待使用用户记录...
【专利技术属性】
技术研发人员:闫莉,戚婷,高建清,孙境廷,
申请(专利权)人:安徽听见科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。