语义辨识方法技术

技术编号:9841210 阅读:88 留言:0更新日期:2014-04-02 04:20
本发明专利技术系提供一种语义辨识方法,包括下列步骤:接收一语音信号;将语音信号辨识为一包含有音译字符组的音译字符序列;将音译字符组的每一个音译字符转换为一拼音字母件组;将拼音字母件组予以依序比对于参考拼音字母件组而得到相似度系数;以及依据相似度系数决定对应的参考音译字符组,藉此改善语音辨识的正确率,使辨识出的语义更接近输入音讯的原意。

【技术实现步骤摘要】
【专利摘要】本专利技术系提供一种,包括下列步骤:接收一语音信号;将语音信号辨识为一包含有音译字符组的音译字符序列;将音译字符组的每一个音译字符转换为一拼音字母件组;将拼音字母件组予以依序比对于参考拼音字母件组而得到相似度系数;以及依据相似度系数决定对应的参考音译字符组,藉此改善语音辨识的正确率,使辨识出的语义更接近输入音讯的原意。【专利说明】
本专利技术系关于一种语音辨识方法,特别是关于一种。
技术介绍
早先,使用者与电子产品沟通的方式可以使用键盘、鼠标或触碰屏幕来输入信息,而随着科技的进步,一种较为自然的沟通方式也发展出来,即为语音输入。使用者利用语音输入的方式以及电子产品的语音输出而达到自然对话的效果。而语音输入的过程大体上如下所述,当声音藉由模拟到数字的转换而输入至计算机的内部,并以数值方式储存后,语音辨识程序将已事先储存好的声音样本与输入的测试声音样本进行比对。比对完成后输入一个它认为最「像」的声音样本序列,就可以知道使用者刚刚念进去的声音代表何意,进而能够控制电器设备作各种事情或其它用途。语音辨识系统的性能受许多因素的影响,包括不同的人说出的话、说话方式、环境噪音及传输信道等等,因此辨识出来的往往会有错误,只有音对,而意不对,譬如,「脏话」和「彰化」、「市民大道」和「四名大盗」。甚至是音也不对,譬如,「姓胡」和「幸福」,所以辨识出来的通常只有音的转译,而不完全是语义的翻译。如此一来,当辨识出来的结果已经有误的情况下,利用文法结构校正的方式来作语义修正的效果是有限的,所以辨识出来的结果上总是会与实际输入的语音有差。以习知方式要达到高准确率的语音辨识,必须要建立大量的声音样本,譬如男生的声音样本、女性的声音样本、同语言不同腔调的声音样本等等,而且声音的档案比文字的档案大上许多,比对的过程更是繁杂,导致语音辨识须利用高阶计算机比对才有较高的辨识率,也因此难以广泛使用。
技术实现思路
本专利技术的主要目的是提供一种,以改善语音辨识的正确率,使辨识音讯出来的语义更接近输入音讯的原意。本专利技术为解决习知技术的问题所采用的技术手段系提供一种,包括下列步骤:(a)接收一语音信号;(b)将语音信号辨识为一音译字符序列,音译字符序列包含有至少一个由一音译字符所组成的音译字符组;(C)将音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;(d)将音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到音译字符组与参考音译字符组的相似度系数;以及(e)依据分别所得的相似度系数决定音译字符组于数据库中所对应的参考音译字符组。在本专利技术的一实施例中,语音信号系为以非拉丁字母为字母的语音信号。在本专利技术的一实施例中,拼音字母件组系为拉丁字母所拼音组成。在本专利技术的一实施例中,步骤(a)还包括:(al)将语音信号录音并取样;(a2)将语音信号的取样转换为一语音数字数据;以及(a3)将语音数字数据传送至一辨识装置。在本专利技术的一实施例中,在步骤(b)与步骤(C)之间,还包括将音译字符序列的音译字符组分组的步骤(bl)。在本专利技术的一实施例中,步骤(bl)中音译字符序列的音译字符组系根据文法结构的分析来分组。在本专利技术的一实施例中,步骤(b)还包括给予音译字符序列的音译字符组一对应词性,以及步骤(bl)系依据对应词性而分组音译字符序列的音译字符组。在本专利技术的一实施例中,每一个组具有一预设的优先度。在本专利技术的一实施例中,步骤(d)系根据每一个组的优先度而从优先度高的组至优先度低的组进行比对。在本专利技术的一实施例中,步骤(e)之后还包括一依据音译字符序列所对应的每一个相似度最高的参考音译字符组而决定音译字符序列的对应的功能指令的步骤(f)。在本专利技术的一实施例中,步骤(f)之后还包括依据功能指令而输出一执行信息的步骤。在本专利技术的一实施例中,执行信息系为一搜寻关键词串,搜寻关键词串系被输出至一搜寻引擎进行搜寻。在本专利技术的一实施例中,执行信息系为一控制信号,控制信号系被输出至一执行设备执行作业。在本专利技术的一实施例中,当无法决定音译字符序列的特定的功能指令时,步骤(f)之后还包括下列步骤:(gl)输出一再确认要求,再确认要求系对音译字符序列的音译字符组进行再确认的要求;(g2)接受响应于再确认要求的一再确认信号;以及(g3)依据音译字符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能指令。本专利技术具有以下有益技术效果:经由本专利技术所采用的技术手段,可以提高语音辨识的正确率,并且因为采用的拼音的比对是属于文字的比对,所以是建立文字的数据库来比对,而省去建立庞大的声音样本数据库。以及决定音译字符序列的对应的功能指令,并且依据功能指令而输出一执行信息,藉此,在语音输入的语义若是控制执行设备或是想得到某种信息时,使得语音输入的语义被辨识出来而更准确执行。此外,本专利技术将音译字符组进行分组并给予优先度,以及给予对应词性,在比对流程的执行更有效率。【专利附图】【附图说明】图1系显示本专利技术的第一实施例的的流程图。图2系显示应用有本专利技术的第一实施例的的电子设备的方块图。图3系显示应用有本专利技术的第一实施例的的电子设备的示意图。图4系显示本专利技术的第二实施例的的流程图。图5系显示应用有本专利技术的第二实施例的的电子设备的方块图。主要组件符号说明100电子设备I撷取装置11录音单元12取样单元13传输单元2辨识装置21辨识单元22转换单元3数据库4拼音比对装置41分组单元42拼音转换单元43比对单元5输出单元6执行设备【具体实施方式】本专利技术所采用的具体实施例,将藉由以下的实施例及附呈图式作进一步的说明。参阅图1及图2所示,图1系显示本专利技术的第一实施例的的流程图,图2系显示本专利技术的第一实施例的的电子设备的方块图。如图所示,本专利技术的第一实施例的可执行于一电子设备中,用以辨识一输入音讯的语义,进而给予对应的回应。电子设备100在本实施例中包括一撷取装置1、一辨识装置2、一数据库3、一拼音比对装置4、以及一输出单元5。其中撷取装置I包含一录音单元11、一取样单元12及一传输单元13,辨识装置2包含一辨识单元21、一转换单元22,拼音比对装置4包含一分组单元41、一拼音转换单元42及一比对单元43。首先,输入语音信号(步骤S110)。例如,撷取装置I中的录音单元11接收使用者讲的一段语音信号,并且将语音信号储存起来(步骤S111)。取样单元12将语音信号的背景杂音删除并且取样后转成语音数字数据(步骤S112)。然后传输单元13将所取样的语音数字数据传送至辨识装置2 (步骤S113)。撷取装置I可为智能型手机、个人计算机或智能型电视等,辨识装置2可以是远程服务器,而传输单元13借着因特网将取样的语音数字数据传送至辨识装置2。当取样的语音数字数据传送至辨识装置2后,辨识装置2运用语音识别技术(Automatic Speech Recognition, ASR)将取样的语音数字数据与数据库3中的参考语音数字数据进行比对,而得出最匹配的参考语音数字数据,并且根据所得的参考语音数字数据而取得取样的语音数字数据所对应的音译字符序列(步骤S120)。详细而言,在本实施例中,辨识单元21是利用隐藏式马可夫模型(Hidden 本文档来自技高网
...

【技术保护点】
一种语义辨识方法,其特征在于,包括下列步骤:(a)接收一语音信号;(b)将该语音信号辨识为一音译字符序列,该音译字符序列系包含有至少一个由一音译字符所组成的音译字符组;(c)将该音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;(d)将该音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的相似度系数;以及(e)依据分别所得的该相似度系数决定该音译字符组于该数据库中所对应的该参考音译字符组。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:李志成
申请(专利权)人:中瀚国际语识有限公司
类型:发明
国别省市:台湾;71

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1