【技术实现步骤摘要】
语言模型构建方法、装置及存储介质
本公开涉及人工智能
,特别是涉及一种语言模型构建方法、装置及存储介质。
技术介绍
如今,随着人工智能技术日益发展,为了使人工智能中的语音识别技术可以应用于更多的场景,需要存储大量的语料。在相关技术中,为了适应特定领域的语音识别,需要构建的语言模型针对性的偏向于特定领域,在实际应用中,用户在特定领域中表达一个含义的语句可以有多种句式,一个句式可以表示不同的指令,比如,句式可以是“播放某歌手演唱的某歌曲”,其中歌手与歌曲的数量巨大,大量的句式语料需要使用脚本构造句式,从而生成大量的语料。然而,相关技术中的方案,使用脚本生成固定一个句式的所有情况的语料,这种方案会导致生成的语料过多,生成语料的时间过长,从而导致构建语言模型的效率不高。
技术实现思路
本公开提供一种语言模型构建方法、装置及存储介质。所述技术方案如下:根据本公开实施例的第一方面,提供了一种语言模型构建方法,其特征在于,所述方法包括:根据获取的至少一个句式框架,确定框架模型,所述 ...
【技术保护点】
1.一种语言模型构建方法,其特征在于,所述方法包括:/n根据获取的至少一个句式框架,确定框架模型,所述句式框架中包含至少一个变量元素和至少一个恒量元素,所述框架模型用来指示所述句式框架对应的语言模型;/n根据获取的所述变量元素对应的数据,确定变量模型,所述变量模型用来指示所述变量元素对应的语言模型;/n将所述框架模型和所述变量模型进行结合,确定第一语言模型。/n
【技术特征摘要】
1.一种语言模型构建方法,其特征在于,所述方法包括:
根据获取的至少一个句式框架,确定框架模型,所述句式框架中包含至少一个变量元素和至少一个恒量元素,所述框架模型用来指示所述句式框架对应的语言模型;
根据获取的所述变量元素对应的数据,确定变量模型,所述变量模型用来指示所述变量元素对应的语言模型;
将所述框架模型和所述变量模型进行结合,确定第一语言模型。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的至少一个句式框架,确定框架模型,包括:
获取至少一个所述句式框架,将所述句式框架组合生成语料文本;
根据N-Gram语言模型算法,将所述语料文本对应的所述语言模型确定为所述框架模型;
将所述框架模型转换成框架模型的有限状态传感器FST图。
3.根据权利要求2所述的方法,其特征在于,所述获取至少一个句式框架,生成语料文本,包括:
通过自定义编译输入的句式,获取至少一个所述句式框架;
和\或,
通过接收语音识别的句式,获取至少一个所述句式框架。
4.根据权利要求1所述的方法,其特征在于,所述根据获取的所述变量元素对应的数据,确定变量模型,所述变量模型用来指示所述变量元素对应的语言模型,包括:
获取所述句式框架中的至少一个所述变量元素中的数据,生成至少一个数据文本;
根据N-Gram语言模型算法,将所述数据文本对应的所述语言模型确定为所述变量模型;
将所述变量模型转换成变量模型的有限状态传感器FST图。
5.根据权利要求2或4所述的方法,其特征在于,所述将所述框架模型和所述变量模型进行结合,确定第一语言模型,包括:
将所述变量模型的FST图添加在所述框架模型的FST图中的变量元素的位置,确定所述第一语言模型的有限状态传感器FST图。
6.一种语言模型构建装置,其特征在于,所述装置包括:
框架确定模块,用于根据获取的至少一个句式框架,确定框架模型,所述句式框架中包含至少一个变量元素和至少一个恒量元素,所述框架模型用来指示所述句式框架对应的语言模型;
变量确定模块,用于根据获取的所述变量元素对应的数据,确定变量模型,所述变量模型用来指示所述变量元素对应的语言模型;
模...
【专利技术属性】
技术研发人员:祖拓,冯大航,陈孝良,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。