System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多粒度会议概述模型制造技术_技高网

多粒度会议概述模型制造技术

技术编号:40123362 阅读:6 留言:0更新日期:2024-01-23 21:00
本文一般讨论的是用于以下目的的设备、系统和方法。方法可包括通过用户界面从用户接收分割粒度值,该分割粒度值指示转录中要包括在概述中的事件数目;由排名器模型从该转录中提取数目等于该事件数目的提示;由包括经重新训练的语言模型的概述器模型生成转录中与事件相对应的一部分的相应概述,针对每个事件生成一个相应概述;以及提供相应概述作为该转录的总体概述。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、语音转文本技术可以提供会议期间所说内容的如实记录。语音转文本技术使用计算机来识别口语并将其转换成文本。随后可以以非音频格式对文本进行理解和搜索。当前的语音转文本技术仅仅提供所提供音频的转录。该转录通常包括每一个话语,包括“ummm”、“uhhhh”、“like(比如)”和人们通常使用的其他语义上的临时词。


技术实现思路

1、提供了一种配置成用于多粒度转录概述的设备、系统、方法和计算机可读介质。会议概述是可变的,并且可变性可以由用户控制(诸如通过应用编程接口(api)、用户界面(ui)等)。可以通过提供要在概述中总结的话题(有时称为“关键字”或“事件”)来控制会议概述长度。概述器模型可以被训练成基于定义概述的内容和长度的输入来生成概述。

2、一种方法可包括通过用户界面从用户接收分割粒度值,该分割粒度值指示转录中要包括在概述中的事件数目。该方法可包括由排名器模型从转录中提取数目等于事件数目的提示。该方法可包括由包括经重新训练的语言模型的概述器模型生成转录中与事件相对应的一部分的相应概述,针对每个事件生成一个相应概述。该方法可包括提供各相应概述作为转录的总体概述。

3、该方法可包括通过用户界面从用户接收指示相应概述中的每一者的长度的概述粒度值。可以由概述器模型并基于概述粒度值来生成相应概述,以具有与该概述粒度值一致的长度。该方法可以进一步包括通过用户界面从用户接收指示要概述的一个或多个事件的话题数据。可以由概述器模型并基于话题数据来生成相应概述,以覆盖由该话题数据指示的事件。

4、该方法可以进一步包括通过用户界面从用户接收指示要概述的一个或多个说话者的说话者数据。可以由概述器模型并基于说话者数据来生成相应概述,以覆盖由该说话者数据指示的该一个或多个说话者所说的话语。该方法可以进一步包括通过用户界面从用户接收指示总体概述要多流畅的可读性数据。可以由概述器模型生成相应概述,其在由可读性数据指示的级别上是可读的。可读性数据可以指示是否要通过标识和掩码来移除填充词、以及是否要基于事件的排名来分割转录。

5、概述器模型可以通过对转录中的关键字进行掩码并使概述器模型生成填充经掩码的关键字的未经掩码的转录来训练。该方法可以进一步包括基于转录与未经掩码的转录之间的差异来调整概述器模型的权重,以生成预训练的概述器模型。该方法可以进一步包括基于提示、转录和预生成的概述来微调预训练的概述器模型。提示可包括可读性数据、话题数据、说话者数据、概述粒度值和分割粒度值中的两者或更多者。

本文档来自技高网...

【技术保护点】

1.一种用于生成会议的转录的多粒度概述的计算机实现的方法,所述方法包括:

2.如权利要求1所述的方法,进一步包括:

3.如权利要求1所述的方法,进一步包括:

4.如权利要求1所述的方法,进一步包括:

5.如权利要求1所述的方法,进一步包括:

6.如权利要求5所述的方法,其中所述可读性数据指示是否要通过标识和掩码来移除填充词、以及是否要基于事件的排名来分割所述转录。

7.如权利要求1所述的方法,其中所述概述器模型通过以下操作来训练:

8.如权利要求7所述的方法,其中所述提示包括可读性数据、话题数据、说话者数据、概述粒度值和分割粒度值中的两者或更多者。

9.一种用于多粒度会议概述的系统,所述系统包括:

10.如权利要求9所述的系统,其中所述操作进一步包括:

11.如权利要求9所述的系统,其中所述操作进一步包括:

12.如权利要求9所述的系统,其中所述操作进一步包括:

13.如权利要求9所述的系统,其中所述操作进一步包括:

14.如权利要求13所述的系统,其中所述可读性数据指示是否要通过标识和掩码来移除填充词、以及是否要基于事件的排名来分割所述转录。

15.如权利要求9所述的系统,其中所述概述器模型通过以下操作来训练:

16.如权利要求15所述的系统,其中所述提示包括可读性数据、话题数据、说话者数据、概述粒度值和分割粒度值中的两者或更多者。

17.一种包括指令的机器可读介质,所述指令在由机器执行时使所述机器执行用于多粒度转录概述的操作,所述操作包括:

18.如权利要求17所述的机器可读介质,其中所述操作进一步包括:

19.如权利要求17所述的机器可读介质,其中所述操作进一步包括:

20.如权利要求17所述的机器可读介质,其中所述操作进一步包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于生成会议的转录的多粒度概述的计算机实现的方法,所述方法包括:

2.如权利要求1所述的方法,进一步包括:

3.如权利要求1所述的方法,进一步包括:

4.如权利要求1所述的方法,进一步包括:

5.如权利要求1所述的方法,进一步包括:

6.如权利要求5所述的方法,其中所述可读性数据指示是否要通过标识和掩码来移除填充词、以及是否要基于事件的排名来分割所述转录。

7.如权利要求1所述的方法,其中所述概述器模型通过以下操作来训练:

8.如权利要求7所述的方法,其中所述提示包括可读性数据、话题数据、说话者数据、概述粒度值和分割粒度值中的两者或更多者。

9.一种用于多粒度会议概述的系统,所述系统包括:

10.如权利要求9所述的系统,其中所述操作进一步包括:

11.如权利要求9所述的系统,其中所述操作进一步包括:

<...

【专利技术属性】
技术研发人员:C·朱刘洋N·曾X·黄钟鸣王元涛熊炜
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1