一种声音信息的处理方法、装置及电子设备制造方法及图纸

技术编号:26304157 阅读:24 留言:0更新日期:2020-11-10 19:59
本发明专利技术公开了一种声音信息的处理方法、装置、电子设备及计算机可读存储介质,该处理方法包括:获取待处理的声音信息;根据声音信息,生成对应的文本摘要和图形摘要;在声音信息对应的展示位上展示文本摘要和图形摘要。

【技术实现步骤摘要】
一种声音信息的处理方法、装置及电子设备
本专利技术涉及互联网
,更具体地,涉及一种声音信息的处理方法、一种声音信息的处理装置、一种电子设备、及一种计算机可读存储介质。
技术介绍
随着互联网技术的飞速发展,越来越多的应用程序可以提供声音信息的评论、新闻信息等功能。由于声音是线性的,需要用户顺序收听之后,才能够确定对应的声音信息是否符合自身喜好。而现有的其他媒体信息,比如图文数据等,用户可以在一秒钟可以扫描文字、图片,来判断出对应的媒体信息是否符合自身喜好,但是声音信息则需要10秒以上。另外,图文信息通常有标题和封面图辅助用户快速筛选出感兴趣的内容。而声音信息难以有声音摘要,尤其是用户原创内容的声音信息。这就导致用户筛选喜好的声音信息的时间成本较高,影响用户体验。
技术实现思路
本专利技术的一个目的是提供一种处理声音信息的新技术方案。根据本专利技术的第一方面,提供了一种声音信息的处理方法,包括:获取待处理的声音信息;根据所述声音信息,生成对应的文本摘要和图形摘要;在所述声音信息对应的展示位上展示所述文本摘要和所述图形摘要。可选的,所述根据所述声音信息,生成对应的文本摘要和图形摘要的步骤包括:对所述声音信息的内容进行语音分析,获取所述声音信息的声音特征,并根据所述声音信息的声音特征生成所述图形摘要;其中,所述声音特征包括音量特征、韵律特征、及音色特征中的至少一种;将所述声音信息转换为对应的文本信息,并对所述文本信息进行语义分析得到所述文本摘要。可选的,所述根据所述声音信息,生成对应的文本摘要和图形摘要的步骤还包括:获取所述声音信息的情感特征,其中,所述情感特征包括情感类型和/或情感程度;根据所述情感特征设置所述文本摘要和/或所述图形摘要的显示颜色。可选的,所述获取所述声音信息的情感特征的步骤包括:根据预先构建的情感词库从所述文本信息中提取情感关键词,通过情感结构化模型,对所述情感关键词进行结构化分析,得到所述情感关键词的情感特征,作为所述声音信息的情感特征;其中,所述情感结构化模型是通过对采集的与情感相关的情感词汇进行分类并结构化组织得到的词汇模型;所述情感结构化模型中包括的每个情感词汇都具有对应的情感特征。可选的,所述声音特征包括音量特征和/或韵律特征,所述根据所述声音信息的声音特征生成所述图形摘要的步骤包括:根据所述声音特征,生成对应的声音波形,作为所述图形摘要;和/或,所述声音特征包括音色特征,所述根据所述声音信息的声音特征生成所述图形摘要的步骤包括:确定预设的声音标签中包含的与所述音色特征匹配的目标声音标签,作为所述图形摘要。可选的,所述对所述文本信息进行语义分析得到所述文本摘要的步骤包括:提取所述文本信息中的关键语句或关键词,作为所述文本摘要;或者,通过预设的自然语言分析模型对所述文本信息进行处理,生成所述文本摘要。可选的,所述在在所述声音信息对应的展示位上展示所述文本摘要和所述图形摘要之后还包括:响应于播放所述声音信息的操作,播放所述声音信息。可选的,所述播放所述声音信息的操作包括:针对所述声音信息的展示位的点击操作。根据本专利技术的第二方面,提供了一种声音信息的处理装置,包括:声音获取模块,用于获取待处理的声音信息;摘要生成模块,用于根据所述声音信息,生成对应的文本摘要和图形摘要;摘要展示模块,用于在所述声音信息对应的展示位上展示所述文本摘要和所述图形摘要。根据本专利技术的第三方面,提供了一种电子设备,包括:根据本专利技术第二方面所述的处理装置;或者,处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器执行根据本专利技术第一方面所述的处理方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如本专利技术第一方面所述的处理方法。在本专利技术的实施例中,通过根据声音信息生成对应的文本摘要和图形摘要,并在对应的展示位上展示该文本摘要和图形摘要,这样,在用户看到该声音信息的图形摘要和文本摘要时,无需播放该声音信息就能快速、直接地了解声音信息的内容、声音特征以及情感特征,可以使得用户能够更加快速地筛选出喜好的声音信息。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是显示可用于实现本专利技术的实施例的电子设备的硬件配置的例子的框图。图2示出了本专利技术的实施例的声音信息的处理方法的流程图。图3示出了展示界面中引导用户输入用户声音信息的例子的示意图。。图4示出了展示声音信息的图形摘要和文本摘要的例子的示意图。图5示出了本专利技术的实施例的声音信息的处理方法的步骤的示意图。图6示出了本专利技术的实施例的声音信息的处理装置的框图。图7示出了本专利技术的实施例的电子设备的一个例子的框图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。<硬件配置>图1是示出可以实现本专利技术的实施例的电子设备1000的硬件配置的框图。电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。...

【技术保护点】
1.一种声音信息的处理方法,其中,包括:/n获取待处理的声音信息;/n根据所述声音信息,生成对应的文本摘要和图形摘要;/n在所述声音信息对应的展示位上展示所述文本摘要和所述图形摘要。/n

【技术特征摘要】
1.一种声音信息的处理方法,其中,包括:
获取待处理的声音信息;
根据所述声音信息,生成对应的文本摘要和图形摘要;
在所述声音信息对应的展示位上展示所述文本摘要和所述图形摘要。


2.根据权利要求1所述的处理方法,其中,所述根据所述声音信息,生成对应的文本摘要和图形摘要的步骤包括:
对所述声音信息的内容进行语音分析,获取所述声音信息的声音特征,并根据所述声音信息的声音特征生成所述图形摘要;其中,所述声音特征包括音量特征、韵律特征、及音色特征中的至少一种;
将所述声音信息转换为对应的文本信息,并对所述文本信息进行语义分析得到所述文本摘要。


3.根据权利要求2所述的处理方法,其中,所述根据所述声音信息,生成对应的文本摘要和图形摘要的步骤还包括:
获取所述声音信息的情感特征,其中,所述情感特征包括情感类型和/或情感程度;
根据所述情感特征设置所述文本摘要和/或所述图形摘要的显示颜色。


4.根据权利要求3所述的处理方法,其中,所述获取所述声音信息的情感特征的步骤包括:
根据预先构建的情感词库从所述文本信息中提取情感关键词,通过情感结构化模型,对所述情感关键词进行结构化分析,得到所述情感关键词的情感特征,作为所述声音信息的情感特征;
其中,所述情感结构化模型是通过对采集的与情感相关的情感词汇进行分类并结构化组织得到的词汇模型;所述情感结构化模型中包括的每个情感词汇都具有对应的情感特征。


5.根据权利要求2所述的处理方法,其中,
所述声音特征包括音量特征和/或韵律特征,所述根据所述声音信息的声音特征生成所述图形摘要的步骤包括:

【专利技术属性】
技术研发人员:贾锦杰曹凌
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1