本发明专利技术提供一种具有影音文件处理功能的电子装置及影音文件处理方法,电子装置包括处理器、存储器、语音识别单元和匹配单元,存储器中存储有语音特征数据库,语音特征数据库包括多个用户的语音特征,每个语音特征与一用户名相对应;语音识别单元用于提取所述音频/视频文件中的语音特征,然后将提取出的语音特征与语音特征数据库中的多个语音特征进行比较,从而能够确定所述音频/视频文件中发言的用户的用户名;匹配单元用于记录与所述确定在的所述音频/视频文件中发言的用户的用户名相对应的发言的时间段;处理器用于根据所述确定的在所述音频/视频文件中发言的用户的用户名及与所述用户名相对应的时间段生成一标签文件。
【技术实现步骤摘要】
本专利技术涉及一种电子装置,尤其涉及一种具有影音文件处理功能的电子装置。
技术介绍
通常,人们在作会议记录时会使用录音笔,在会后可以通过听取录音笔录制的内容补充会上没有记住的内容。有时,需要听完把录音笔录制的内容全部听完才能确定每个发言人的发言内容,这样可能需要较长的时间。
技术实现思路
有鉴于此,本专利技术提供一种电子装置,其能够生成包含用户名和其发言的时间段的标签文件,用户能够根据标签文件的内容快速的确定每个会议参加者发言时的时间段。一种具有影音文件处理功能的电子装置,包括处理器和存储单元,还包括语音识别单元和匹配单元,该存储单元中存储有语音特征数据库,该语音特征数据库包括多个用户的语音特征,每个语音特征与一用户名相对应;该处理器响应使用者的请求而播放特定的音频文件或视频文件,该语音识别单元用于提取所述音频文件或视频文件中的语音特征,然后将提取出的语音特征与该语音特征数据库中的多个语音特征进行比较,从而能够确定所述音频文件或视频文件中发言的用户的用户名;该匹配单元用于记录与所述确定在的所述音频文件或视频文件中发言的用户的用户名相对应的发言的时间段;该处理器用于根据所述确定的在所述音频文件或视频文件中发言的用户的用户名及与所述用户名相对应的时间段生成一标签文件,该处理器将所述标签文件与所述音频文件或视频文件关联起来,从而允许用户通过标签文件找到与标签文件相关联的音频文件或视频文件。一种音频文件/视频文件处理方法,包括接收待处理的音频文件/视频文件;提取待处理的音频文件/视频文件中的用户语音特征;确定与待处理的音频文件/视频文件中的用户语音特征相对应的用户名;确定每个用户名所对应的发言时间段;生成与待处理的音频文件/视频文件中的用户语音特征相关联的标签文件。使用本专利技术的电子装置生成的标签文件,用户能够快速的确定每个会议参加者发言时的时间段,从而便于用户快速的确定某个特定人员的发言内容。附图说明图I为本专利技术的电子装置的模块图。图2为本专利技术的电子装置处理音频文件/视频文件的流程图。图3为本专利技术的电子装置的供用户查询的查询界面。主要元件符号说明电子装置100影音录制装置200处理器10存储单元20语音识别单元30语音转换文字单元40匹配单元50查询界面60检索条件区61输入框611输入框612输入框613检索结果区62用户名621标签文件名622时间段623播放模块63文字显示框64如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式请参阅图1,在本实施方式中,本专利技术的电子装置100包括语音特征数据库,该语 音特征数据库中包括多个用户的语音特征,该电子装置100能够根据所述多个用户的语音 特征识别出待处理的音频文件/视频文件中发言的用户。该电子装置100能记录识别出来 的用户的发言的时间段。该电子装置100能够基于识别出来的用户以及该用户发言的时间 段生成可编辑的、可搜索的标签文件。每一个标签文件与相应的音频文件/视频文件相关 联,如此,用户可以通过关键词搜索方式找到其所需的音频文件/视频文件。例如,假定一个名称为“会议记录20120820”的音频文件的内容为用户甲、用户乙、 用户丙、用户丁讨论商品买卖合同的事宜,该电子装置100能够至少建立4个标签文件,每 个标签文件的内容分别为“用户甲,发言时间段:0:00-1:30、2:10-5:20”、“用户乙,发言时 间段1:30-2:10、5:20-6:40”、“用户丙,发言时间段6:40-8:50”、“用户丙,发言时间段 8:50-10:30”。当使用者以“用户甲”为关键词在电子装置100中搜索时,能够搜索到标签 文件“用户甲,发言时间段0:00-1:30、2:10-5:20”,如此使用者能够在听音频文件“会议 记录20120820”时,可以有选择的听取0:00-1:30及2:10-5:20两个时间段的内容即可确 定用户甲的发言内容,不必听完整个音频文件。在本实施方式中,该电子装置100为远程的服务器,用户可以通过手机等手持设 备或计算机访问该电子装置100。该电子装置100可以基于用户的请求而对用户选定的音 频文件/视频文件进行处理,该电子装置100还可以通过有线网络或者无线网络而与一影 音录制装置200 (例如,录音笔、DV摄像机或者具有影音录制功能的手机)相连接,并且影音 录制装置200与电子装置100通讯时会向电子装置100发送一标识符(identifier),该电 子装置100能通过该标识符识别出该影音录制装置200,如此,在接收到影音录制装置200 传送的音频文件/视频文件后,该电子装置100立即对该音频文件/视频文件进行处理。在本实施方式中,该电子装置100包括处理器10、存储单元20、语音识别单元30、 语音转换文字单元40和匹配单元50。该存储单元20存储有上述的语音特征数据库,该语 音特征数据库中的每个语音特征对应唯一的用户名。该语音特征数据库是可更新的,例如, 参加一个会议的人员中有一个或多个人的语音特征没有存储在该语音特征数据库中时,该一个或多个人员可以各自录制一段语音样本上传到电子装置100,该处理器10响应用户的语音特征提取请求根据上传的语音样本提取语音特征,然后根据用户的输入将该提取出的语音特征与一输入的用户名相关联,最后将提取出的语音特征及与之相关联的用户名存储到语音特征数据库中,从而完成语音特征数据库的更新。当接收到用户的请求或者待处理的音频文件/视频文件后,该处理器10播放待处理的音频文件/视频文件,该语音识别单元30提取该音频文件/视频文件中的语音特征, 并且将该提取出的语音特征与存储单元20中存储的语音特征相比较,从而能够确定音频文件/视频文件中的每段语音所对应的用户名。在待处理的音频文件/视频文件播放过程中,该语音转换文字单元40将待处理的音频文件/视频文件中的语音内容转换为文字。该匹配单元50用于将语音识别单元30确定的用户名与语音转换文字单元40转换的文字匹配起来。在本实施方式中,该匹配单元50首先获取该待处理的音频文件/视频文件的播放时长,然后将该播放时长均分为N个子区间,自该待处理的音频文件/视频文件播放开始,该匹配单元50依次记录在每个子区间内的语音内容所对应的用户名以及语音转换文字单元40转换的文字。最终,该匹配单元50将均对应为同一用户名的连续子区间整理为一时间段,生成包含用户名、与之对应的时间段、以及与每个时间段对应的文字内容。该处理器10在匹配单元50生成的文本文件的基础上生成标签文件,并将标签文件存储在该存储单元20中。在本实施方式中,该处理器10首先获取存储单元20中的语音数据库中的用户名,然后在上述文本文件中搜索上述获得的用户名,最后将每个搜索到的用户名及与其对应的文字和时间段根据预定的模板整合为一标签文件。在其它实施方式中,该处理器10会获取待处理文件的创建时间,将该创建日期默认为待处理音频文件/视频文件中的语音内容发生的日期并将该创建日期与用户名及与其对应的文字和时间段整合为一标签文件。由于该每个标签文件均是可编辑的,在需要时, 用户可以在标签文件中进行修改或者添加其它的信息,例如,语音内容发生的地点。在本实施方式中,该处理器10在还可在每一标签文件中的插入链接,通过该链接将每一本文档来自技高网...
【技术保护点】
一种具有影音文件处理功能的电子装置,包括处理器和存储单元,其特征在于:还包括语音识别单元和匹配单元,该存储单元中存储有语音特征数据库,该语音特征数据库包括多个用户的语音特征,每个语音特征与一用户名相对应;该处理器响应使用者的请求而播放特定的音频文件或视频文件,该语音识别单元用于提取所述播放的音频文件或视频文件中的语音特征,然后将提取出的语音特征与该语音特征数据库中的多个语音特征进行比较,从而能够确定所述音频文件或视频文件中发言用户的用户名;该匹配单元用于记录与所述播放的音频文件或视频文件中发言用户的用户名相对应的发言时间段;该处理器用于根据所述播放的音频文件或视频文件中发言用户的用户名及与所述用户名相对应的发言时间段生成一标签文件,该处理器将所述标签文件与所述播放的音频文件或视频文件关联起来,从而允许用户通过标签文件找到与标签文件相关联的音频文件或视频文件。
【技术特征摘要】
【专利技术属性】
技术研发人员:蒋浩良,
申请(专利权)人:鸿富锦精密工业深圳有限公司,鸿海精密工业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。