一种信息处理方法、装置、介质和设备制造方法及图纸

技术编号:31305787 阅读:11 留言:0更新日期:2021-12-12 21:20
本发明专利技术涉及一种信息处理方法、装置、介质和设备。根据本发明专利技术实施例提供的方案,可以根据启动消息,自动获取采集装置采集到的音频信息,将获取到的音频信息装换为文本信息,并保存为该采集装置对应的用户标识所对应的文本信息,从而实现音频信息对应的文本信息的自动记录。本实施例提供的方案适用于任何需要对音频信息对应的文本信息进行自动记录的场景,如果将其应用于会议进行过程中,对每个人的发言内容对应的文本信息进行自动记录,则可以实现会议内容的高效准确记录,解决人工记录会议内容时,低效,且容易产生错误的问题。且容易产生错误的问题。且容易产生错误的问题。

【技术实现步骤摘要】
一种信息处理方法、装置、介质和设备


[0001]本专利技术涉及通信
,特别涉及一种信息处理方法、装置、介质和设备。

技术介绍

[0002]会议是指有组织、有领导、有目的的议事活动,在限定的时间和地点,按照一定的程序进行。生活中很多场景都会用到会议,如投票选举会议、公司年度会议等等。
[0003]在会议进行过程中,通常需要人工将会议内容记录为文本,会议内容包括每个人的发言内容。这样会耗费大量的人力,且容易产生漏记录、误记录等问题。
[0004]如何高效准确地实现会议内容的记录,成为目前急需解决的问题。

技术实现思路

[0005]本专利技术实施例提供一种信息处理方法、装置、介质和设备,用于解决无法高效准确地记录会议内容的问题。
[0006]本专利技术提供了一种信息处理方法,所述方法包括:
[0007]接收启动消息,所述启动消息中携带采集装置标识;
[0008]获取与所述采集装置标识相对应的采集装置所采集到的音频信息;
[0009]将所述音频信息转换为文本信息;
[0010]确定所述采集装置标识对应的用户标识,将所述文本信息保存为该用户标识对应的文本信息。
[0011]本专利技术还提供了一种信息处理装置,所述装置包括:
[0012]音频接收模块,用于接收启动消息,所述启动消息中携带采集装置标识,获取与所述采集装置标识相对应的采集装置所采集到的音频信息;
[0013]语音识别模块,用于将所述音频信息转换为文本信息,确定所述采集装置标识对应的用户标识,将所述文本信息保存为该用户标识对应的文本信息。
[0014]本专利技术还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。
[0015]本专利技术还提供了一种信息处理设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
[0016]所述存储器,用于存放计算机程序;
[0017]所述处理器,用于执行所述存储器上所存储的程序时,实现如上所述的方法步骤。
[0018]根据本专利技术实施例提供的方案,可以根据启动消息,自动获取采集装置采集到的音频信息,将获取到的音频信息装换为文本信息,并保存为该采集装置对应的用户标识所对应的文本信息,从而实现音频信息对应的文本信息的自动记录。本实施例提供的方案适用于任何需要对音频信息对应的文本信息进行自动记录的场景,如果将其应用于会议进行过程中,对每个人的发言内容对应的文本信息进行自动记录,则可以实现会议内容的高效准确记录,解决人工记录会议内容时,低效,且容易产生错误的问题。
[0019]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本专利技术实施例一提供的信息处理方法的流程示意图;
[0022]图2为本专利技术实施例二提供的信息处理装置的结构示意图;
[0023]图3为本专利技术实施例二提供的信息处理过程示意图;
[0024]图4为本专利技术实施例三提供的信息处理设备的结构示意图。
具体实施方式
[0025]考虑到对会议内容进行人工记录存在的不足,本专利技术实施例提供一种对会议内容进行自动记录的方案。
[0026]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0028]本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
[0029]此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0030]实施例一
[0031]本专利技术实施例一提供一种信息处理方法,该方法的步骤流程可以如图1所示,包括:
[0032]步骤101、接收启动消息。
[0033]在本步骤中,可以接收启动消息,所述启动消息中携带采集装置标识。在本专利技术实施例中,采集装置可以理解为任意可以实现音频采集的装置,例如,麦克风等。
[0034]启动消息可以通过任意形式触发,例如,通过按下指定按键触发。
[0035]步骤102、获取音频信息。
[0036]若在步骤101中接收到启动消息,在本步骤中,可以获取与采集装置标识对应的采集装置采集到的音频信息,实现音频信息的自动获取。
[0037]步骤103、进行文本转换。
[0038]在本步骤中,可以将接收到的音频信息转换为文本信息。
[0039]在一种可能的实现方式中,将接收到的音频信息转换为文本信息,可以包括:
[0040]对所述音频信息进行语音端点检测,确定所述音频信息对应的语音信息;
[0041]确定所述语音信息对应的语音特征向量;
[0042]根据确定出的所述语音特征向量,确定对应的文本信息。
[0043]在本实施例中,对音频信息进行语音端点检测,可以但不限于基于语音活动检测(VAD)来实现。基于VAD进行语音端点检测时,可以将音频信息中的静音段切除,保留有效语音段,从而可以从接收到的音频信息中,确定出对应的语音信息来进行后续处理,提高后续处理的效率。
[0044]确定出的语音特征向量,可以但不限于为滤波器组(Fbank)特征向量,或者梅尔频率倒谱系数(MFCC)特征向量。
[0045]此外,根据确定出的所述语音特征向量,确定对应的文本信息的过程中,声学模型可以采用深度神经网络和隐马尔可夫混合(HMM-DNN)模型,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:接收启动消息,所述启动消息中携带采集装置标识;获取与所述采集装置标识相对应的采集装置所采集到的音频信息;将所述音频信息转换为文本信息;确定所述采集装置标识对应的用户标识,将所述文本信息保存为该用户标识对应的文本信息。2.如权利要求1所述的方法,其特征在于,确定所述采集装置标识对应的用户标识,包括:根据预先保存的采集装置标识与用户标识的对应关系,确定所述采集装置标识对应的用户标识。3.如权利要求1所述的方法,其特征在于,将所述音频信息转换为文本信息,包括:对所述音频信息进行语音端点检测,确定所述音频信息对应的语音信息;确定所述语音信息对应的语音特征向量;根据确定出的所述语音特征向量,确定对应的文本信息。4.如权利要求1所述的方法,其特征在于,所述方法还包括:接收关闭消息,所述关闭消息中携带所述采集装置标识;根据所述关闭消息,对保存的所述文本信息进行分词,根据分词结果,提取所述文本信息中的第一关键信息,所述第一关键信息在所述文本信息中的重要程度满足设定要求;将提取出的第一关键信息保存为所述用户标识对应的第一关键信息。5.如权利要求4所述的方法,其特征在于,将提取出的第一关键信息保存为所述用户标识对应的第一关键信息之后,所述方法还包括:将所述文本信息和所述第一关键信息发送到指定的显示器进行显示。6.如权利要求1~5任一所述的方法,其特征在于,所述方法还包括:对保存的至少两个用户标识对应的文本信息分别进行分词,根据分词结果,提取第二关键信息,所述第二关键信息在进行分词的至少两个文本信息中的重要程度满足设定要求;保存提取出的第二关键信息。7.一种信息处理装置,其特征在于,所述装置包括:音频接收模块,用于接收启动消息,所述启动消息中携带采集装置标识,获取与所述采集装置标识相对应的采集装置所采集到的音频信息;语音识别模块,用于将所述音频信息转换为文本信息,确定所述采集装置标识对应的用户标识,将...

【专利技术属性】
技术研发人员:王磊陈孝良冯大航
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1