【技术实现步骤摘要】
离线识别xbnf的编写和维护方法和装置
本专利技术属于语音识别领域,尤其涉及离线识别xbnf的编写和维护方法和装置。
技术介绍
在语音离线识别技术上,原实现方式大部分是根据产品需求,开发人员手动编写对应的xbnf语法文件,编译xbnf生成对应的识别模型资源,然后加载到离线识别引擎,输入音频即输出识别的文本和语义。
技术实现思路
本专利技术实施例提供一种离线识别xbnf的编写和维护方法及装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种离线识别xbnf的编写和维护方法,包括:遍历预设的语料表格,判断遍历的当前栏是否是语义槽栏;若当前栏是语义槽栏,获取所述语义槽栏中的语义槽定义信息,将所述语义槽定义信息写入xbnf顶部,其中,所述语料表格至少包括所述语义槽栏和领域栏,所述语义槽栏中包括语义槽定义信息,所述领域栏包括所述领域栏对应的领域内的说法;基于所述写入xbnf顶部的语义槽定义信息,遍历所述领域内的说法,将所述说法与所述语义槽定义信息汇总后逐行写入所述xbnf,同时拼接语义领域信 ...
【技术保护点】
1.一种离线识别xbnf的编写和维护方法,包括:/n遍历预设的语料表格,判断遍历的当前栏是否是语义槽栏;/n若当前栏是语义槽栏,获取所述语义槽栏中的语义槽定义信息,将所述语义槽定义信息写入xbnf顶部,其中,所述语料表格至少包括所述语义槽栏和领域栏,所述语义槽栏中包括语义槽定义信息,所述领域栏包括所述领域栏对应的领域内的说法;/n基于所述写入xbnf顶部的语义槽定义信息,遍历所述领域内的说法,将所述说法与所述语义槽定义信息汇总后逐行写入所述xbnf,同时拼接语义领域信息形成汇总说法;/n检测所述汇总说法,排除所述汇总说法内存在的xbnf语法错误。/n
【技术特征摘要】
1.一种离线识别xbnf的编写和维护方法,包括:
遍历预设的语料表格,判断遍历的当前栏是否是语义槽栏;
若当前栏是语义槽栏,获取所述语义槽栏中的语义槽定义信息,将所述语义槽定义信息写入xbnf顶部,其中,所述语料表格至少包括所述语义槽栏和领域栏,所述语义槽栏中包括语义槽定义信息,所述领域栏包括所述领域栏对应的领域内的说法;
基于所述写入xbnf顶部的语义槽定义信息,遍历所述领域内的说法,将所述说法与所述语义槽定义信息汇总后逐行写入所述xbnf,同时拼接语义领域信息形成汇总说法;
检测所述汇总说法,排除所述汇总说法内存在的xbnf语法错误。
2.根据权利要求1所述的方法,其中,在所述遍历预设的语料表格之前,还包括:
根据开发者整理的所述各领域和所述各领域的说法形成初始表格,判断所述初始表格是否存在遗漏或者异常;
若异常,修改所述初始表格内的异常语料说法,将所述初始表格输出为语料表格。
3.根据权利要求1所述的方法,其中,在所述判断遍历的当前栏是否是语义槽栏之后,还包括:
若遍历的当前栏不是语义槽栏,获取遍历的当前领域栏中的说法,将所述说法与语义槽定义信息汇总并同时拼接语义领域信息逐行写入xbnf。
4.根据权利要求1所述的方法,其中,所述语料表格的每一个领域栏内还包括至少一个意图,每一个意图下还包括至少一个说法,所述基于所述写入xbnf顶部的语义槽定义信息,遍历所述领域内的说法,将所述说法与所述语义槽定义信息汇总后逐行写入所述xbnf,同时拼接语义领域信息包括:
判断遍历的当前说法是否是当前意图的最后一个说法;
若当前说法不是当前意图的最后一个说法,继续遍历所述当前意图中的说法并逐行写入xbnf;
若当前说法是当前意图的最后一个说法,将所述当前意图的说法与所述说法中包含的语义槽定义信息进行汇总并同时拼接语义领域信息逐行写入所述xbnf,继续遍历当前领域栏中的下一个意图中的说法。
5.根据权利要求4所述的方法,其中,所述方法还包括:
判断所述说法是否是当前领域栏的最后一个说法;
若所述说法是当前领域栏的最后一个说法,判断所述说法是否是最后领域栏的最后一个说法;
若所述说法不是所述最后领...
【专利技术属性】
技术研发人员:邹学勇,胡明国,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。