一种声音的语义分析方法及装置制造方法及图纸

技术编号:12419012 阅读:93 留言:0更新日期:2015-12-02 13:54
本发明专利技术实施例提供一种声音的语义分析方法及装置,其中,该方法包括:获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库;接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果;根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。本发明专利技术实施例提供的声音的语义分析方法及装置能够反馈给用户无语义的声音的语义。

【技术实现步骤摘要】

本专利技术实施例涉及语义分析领域,尤其涉及一种声音的语义分析方法及装置
技术介绍
由于很多生物(例如刚出生的婴儿和家里养的宠物等)的声音的语义无法被普通人理解,所以,很多生物是无法与普通人正常沟通的。婴儿有任何诉求(例如饿了或身体不舒服等)的时候,会发出声音,但是普通人完全无法了解这些声音的语义,导致无法满足婴儿的诉求;宠物在有任何诉求的时候,通常会发出叫声,非专业驯兽师是无法正确识别宠物想要表达的含义的。基于以上这些场景,人们在日常生活中,需要一种能够正确识别生物声音的语义的分析系统,从而使得人类可以正常与生物进行交流沟通。
技术实现思路
本专利技术提供一种声音的语义分析方法及装置,以解决现有技术中无法得知很多生物声音的语义的问题。第一方面,本专利技术实施例提供了一种声音的语义分析方法,包括:获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库;接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果;根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。第二方面,本专利技术实施例还提供了一种声音的语义分析装置,包括:声音样本库形成模块,用于获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库;匹配模块,用于接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果;反馈模块,用于根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。本专利技术实施例提供的声音的语义分析方法及装置,通过为获取的每个来自生物的无语义的基础声音样本设置标签,形成声音样本库后,在声音样本库中对接收的用户输入的待识别声音进行匹配,并根据匹配后的匹配结果将待识别声音对应的基础声音样本的标签反馈给用户,实现了为用户提供待识别声音的语义,进而使得用户了解无语义的声音的语义,从而使得用户了解生物所要表达的含义。【附图说明】图1是本专利技术实施例一提供的声音的语义分析方法的流程图。图2是本专利技术实施例二提供的声音的语义分析方法的流程图。图3是本专利技术实施例三提供的声音的语义分析方法的流程图。图4是本专利技术实施例四提供的声音的语义分析装置的结构图。【具体实施方式】下面结合附图并通过【具体实施方式】来进一步说明本专利技术的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或S)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加S。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一:图1是本专利技术实施例一提供的声音的语义分析方法的流程图,该方法可以由声音的语义分析装置执行,其中该装置可由软件和/或硬件实现,一般可集成在服务器中。如图1所示,该方法包括:S101、获取多个来自生物的无语义的基础声音样本,为各个基础声音样本设置标签,形成声音样本库。每个生物(例如还不会说话的婴儿和宠物等)在不同的情形下,均会发出不同类型的声音,虽然普通人不能理解这些声音的语义,但是很多专业人员(例如育婴师、特级医院护理师或驯兽师等)能够了解这些生物发出的声音所要表达的含义。获取多个生物在不同情形下的无语义的基础声音样本,通过专业人员对上述无语义的基础声音样本进行分析,并为每个基础声音样本建立标签,形成基础声音样本与标签 对应的声音样本库。上述来自生物的无语义的基础声音样本可以为来自婴儿的声音,也可以为来自宠物的声音。上述获取基础声音样本的渠道可以是网络。为了方便后期在声音样本库中对用户输入的待识别声音进行匹配,以及为了保证后期提供给用户的标签的信息的完整性,标签不仅包括基础声音样本对应的语义,还可以包括基础声音样本对应的生物的属性信息,例如种类、性别和年龄等,和/或还可以包括基础声音样本对应的生物所处场景的属性信息,例如婴儿在睡觉过程中、宠物在出门前等场景。S102、接收用户输入的待识别声音,在声音样本库中对待识别声音进行匹配,得到匹配结果。在声音样本库中,对接收到的用户输入的待识别声音与声音样本库中的基础声音样本和/或标签进行匹配。在与基础声音样本进行匹配时,可以通过对比待识别声音的抽象属性值和基础声音样本的抽象属性值,得到匹配结果;在与标签和基础声音样本进行匹配时,可以接收用户输入的待识别声音的同时,接收用户输入的描述信息,通过对比上述描述信息和标签,再将待识别声音与对比得到的标签对应的基础声音样本进行匹配,得到匹配结果。需要说明的是,得到的匹配结果可以有一个,也可以有多个。S103、根据匹配结果将待识别声音对应的基础声音样本的标签反馈给用户。由于S102中得到的匹配结果可以有一个,也可以有多个,因此,该S103中反馈给用户的标签可以有一个,也可以有多个。本专利技术实施例一提供的声音的语义分析方法,为获取的每个来自生物的无语义的基础声音样本设置标签,形成声音样本库后,在声音样本库中对接收的用户输入的待识别声音进行匹配,并根据匹配后的匹配结果将待识别声音对应的基础声音样本的标签反馈给用户。经上述技术方案之后,该方法实现了为用户提供待识别声音的语义,进而使得用户了解无语义的声音的语义,从而使得用户了解生物所要表达的含义。在上述技术方案的基础上,S103之后,还可以根据用户输入的反馈信息对声音样本库进行更新,使得声音样本库中的数据能够实时地更新,进而使得提供给后期的用户的信息更加精准。具体地,可以包括以下:获取用户的反馈信息;根据反馈信息对声音样本库中的基础声音样本和/或基础声音样本对应的标签进行更新。在对声音样本库中的基础声音样本和/或基础声音样本对应的标签进行更新时,可以根据用户输入的反馈信息的类别具体选择如何更新。具体地,可以包括以下:如果反馈信息为对错值或正确比例值,则:统计待识别声音对应的基础声音样本与基础声音样本对应的标签的对应关系的正确率;根据正确率更改基础声音样本对应的标签,或者将正确率添加至基础声音样本对应的标签中。例如,经统计,某个基础声音样本对应于婴儿饿了标签的正确率统计为80%,婴儿尿了标签的正确率统计为10%,婴儿病了标签的正确率为10%。此正确率可作为匹配依据,当匹配结果有多个时,可以基于正确率筛选结果。如果反馈信息为待识别声音的语义描述信息,则:根据语义描述信息提取标签;将待识别声音作为新的基础声音样本,与提取的标签对应存储到声音样本库中。经由上述技术方案,能够根据用户输入的反馈信息对声音样本库进行更新,使得声音样本库中的数据能够实时地更新,进而使得提供给后期的用户的信息更加精准。实施例二:本实施例二以上述实施例一为基础进行优化。在本实施例二中,将实施例一中的S102优化为通过对比待识别声音的抽象属性值和基础声音样本的抽象属性值,得到匹配结果。进一步地,还可以将实施例一中的S103优化为反馈给用户的标签为至少一个。图2是本专利技术实本文档来自技高网...

【技术保护点】
一种声音的语义分析方法,其特征在于,包括:获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库;接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果;根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:李华明王道龙刘晓伟刘孟燕宇飞袁艺吕文玉袁正沧张钰易敏文
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1