一种字体发音确定方法、装置、设备及介质制造方法及图纸

技术编号:37434491 阅读:11 留言:0更新日期:2023-05-06 09:06
本申请公开了一种字体发音确定方法、装置、设备及介质,涉及计算机技术领域,包括:获取语音波形文件,对语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对转换后的文字总信息进行划分,以得到各文字信息;从预设字符集中筛选出与文字信息相对应的所有编码以及相应的字符;根据编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件,以便基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音。通过本申请的技术方案,能够有效提高字体发音确定的准确性,增加字体发音确定的效率,降低字体发音确定的复杂度,减少计算机处理成本。减少计算机处理成本。减少计算机处理成本。

【技术实现步骤摘要】
一种字体发音确定方法、装置、设备及介质


[0001]本专利技术涉及计算机
,特别涉及一种字体发音确定方法、装置、设备及介质。

技术介绍

[0002]文字是人类的伟大专利技术,是一种将视觉图像、抽象概念符号化的结果。从此,人类的交互、对知识的记录,走向了视觉时代。字符编码以及汉字编码的专利技术,更让计算机具备了处理文字信息的能力。计算机通过文字与人类交互现在已经发展得极为成熟。代价是人类普遍用眼过度,因为视觉交互是目前的主流方式。随着录音设备、多媒体技术的发展,计算机具备了对声音的记录手段。人工智能的发展,让计算机渐渐的也具备了听懂人类语言、说话的能力。这又打开了一个使用语音跟计算机交互的新时代。但目前技术还有很多限制。究其根本原因,是缺乏对语音的合适编码方案。现有的语音编码方案是:语音被转换成的字符,视觉符号。也就是说,因为古代并未专利技术可以直接处理语音的工具,对语音的记录只能通过将语音转化为文字符号来处理。当然对于使用拼音文字的国家,这个问题基本上是解决了,其文字本来就是对声音的记录。但汉字则不同,因为汉字本身是表意文字,与其发音没有直接的对应关系,所以使用汉语的民族只能额外借用拼音符号记录发音,但因为其文字材料并不是以拼音写成。这个问题依然存在。当然,现代计算机具备了多媒体能力,能够直接输入和输出语音信号,但受传统路径的影响,尚未专利技术直接对语音进行记录和编码的语音编码系统。就汉字来说,由于发音和汉字并不是一一对应的关系,以汉字来记录发音,就会出现很多问题,如多音字等等都是缺陷。
[0003]由上可见,如何提高字体发音确定的准确性,增加字体发音确定的效率,降低字体发音确定的复杂度,减少计算机处理成本是本领域有待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种标签缺陷检测方法、装置、设备及介质,能够提高字体发音确定的准确性,增加字体发音确定的效率,降低字体发音确定的复杂度,减少计算机处理成本。其具体方案如下:
[0005]第一方面,本申请公开了一种字体发音确定方法,包括:
[0006]获取语音波形文件,对所述语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对所述转换后的文字总信息进行划分,以得到各文字信息;
[0007]从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符;
[0008]根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件,以便基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音。
[0009]可选的,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符之前,还包括:
[0010]创建空白字符集,获取预设的多音字信息和方言信息,并确定出相应的多音词字符和方言字符,按照预设的字符编码规则,为所述多音字字符和所述方言字符创建各编码,并将各所述编码保存至所述空白字符集中的存储区域,以得到字符集。
[0011]可选的,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符,包括:
[0012]根据所述文字信息遍历所述字符集中的各存储区域,以便从各所述存储区域中筛选出与所述文字信息相对应的所有编码以及相应的字符;其中,所述各存储区域包括多音字存储区域和方言存储区域。
[0013]可选的,所述根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件之前,还包括:
[0014]获取预设的历史文字信息,并为所述历史文字信息添加唯一编码,以形成所述历史文字信息与所述唯一编码之间的映射关系,以得到字体文件,并将各字体类型保存至所述字体文件;
[0015]获取预设的历史语音发音信息,根据所述唯一编码,为所述唯一编码添加历史语音发音信息,以形成所述唯一编码与所述历史语音发音信息之间的映射关系,以得到语音文件,并将各语音发音类型保存至所述语音文件。
[0016]可选的,所述基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音之后,还包括:
[0017]根据业务需求从所述字体文件中的各字体类型和所述语音文件中的各语音发音类型中筛选出目标字体类型和目标语音发音类型;
[0018]基于所述目标字体类型和所述目标语音发音类型确定出目标字体和目标发音,将所述目标字体和所述目标发音发送至客户端。
[0019]第二方面,本申请公开了一种字体发音确定装置,包括:
[0020]语音波形文件获取模块,用于获取语音波形文件,对所述语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对所述转换后的文字总信息进行划分,以得到各文字信息;
[0021]筛选模块,用于从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符;
[0022]字体发音确定模块,用于根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件,以便基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音。
[0023]可选的,所述字体发音确定装置,还包括:
[0024]字符集创建模块,用于创建空白字符集,获取预设的多音字信息和方言信息,并确定出相应的多音词字符和方言字符,按照预设的字符编码规则,为所述多音字字符和所述方言字符创建各编码,并将各所述编码保存至所述空白字符集中的存储区域,以得到字符集。
[0025]可选的,所述字体发音确定模块,还包括:
[0026]字体文件创建模块,用于获取预设的历史文字信息,并为所述历史文字信息添加
唯一编码,以形成所述历史文字信息与所述唯一编码之间的映射关系,以得到字体文件,并将各字体类型保存至所述字体文件;
[0027]语音文件创建模块,用于获取预设的历史语音发音信息,根据所述唯一编码,为所述唯一编码添加历史语音发音信息,以形成所述唯一编码与所述历史语音发音信息之间的映射关系,以得到语音文件,并将各语音发音类型保存至所述语音文件。
[0028]第三方面,本申请公开了一种电子设备,包括:
[0029]存储器,用于保存计算机程序;
[0030]处理器,用于执行所述计算机程序,以实现前述的字体发音确定方法。
[0031]第四方面,本申请公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的字体发音确定方法的步骤。
[0032]可见,本申请提供了一种字体发音确定方法,包括获取语音波形文件,对所述语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对所述转换后的文字总信息进行划分,以得到各文字信息;从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符;根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字体发音确定方法,其特征在于,包括:获取语音波形文件,对所述语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对所述转换后的文字总信息进行划分,以得到各文字信息;从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符;根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件,以便基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音。2.根据权利要求1所述的字体发音确定方法,其特征在于,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符之前,还包括:创建空白字符集,获取预设的多音字信息和方言信息,并确定出相应的多音词字符和方言字符,按照预设的字符编码规则,为所述多音字字符和所述方言字符创建各编码,并将各所述编码保存至所述空白字符集中的存储区域,以得到字符集。3.根据权利要求2所述的字体发音确定方法,其特征在于,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符,包括:根据所述文字信息遍历所述字符集中的各存储区域,以便从各所述存储区域中筛选出与所述文字信息相对应的所有编码以及相应的字符;其中,所述各存储区域包括多音字存储区域和方言存储区域。4.根据权利要求1至3任一项所述的字体发音确定方法,其特征在于,所述根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件之前,还包括:获取预设的历史文字信息,并为所述历史文字信息添加唯一编码,以形成所述历史文字信息与所述唯一编码之间的映射关系,以得到字体文件,并将各字体类型保存至所述字体文件;获取预设的历史语音发音信息,根据所述唯一编码,为所述唯一编码添加历史语音发音信息,以形成所述唯一编码与所述历史语音发音信息之间的映射关系,以得到语音文件,并将各语音发音类型保存至所述语音文件。5.根据权利要求4所述的字体发音确定方法,其特征在于,所述基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音之后,还包括:根据业务需求从所述字体...

【专利技术属性】
技术研发人员:沈学东冯立宏何雨可向梦甜陈喆孙阳洋童珈琪张梦銮孙硕
申请(专利权)人:苏州曦动健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1