【技术实现步骤摘要】
一种字体发音确定方法、装置、设备及介质
[0001]本专利技术涉及计算机
,特别涉及一种字体发音确定方法、装置、设备及介质。
技术介绍
[0002]文字是人类的伟大专利技术,是一种将视觉图像、抽象概念符号化的结果。从此,人类的交互、对知识的记录,走向了视觉时代。字符编码以及汉字编码的专利技术,更让计算机具备了处理文字信息的能力。计算机通过文字与人类交互现在已经发展得极为成熟。代价是人类普遍用眼过度,因为视觉交互是目前的主流方式。随着录音设备、多媒体技术的发展,计算机具备了对声音的记录手段。人工智能的发展,让计算机渐渐的也具备了听懂人类语言、说话的能力。这又打开了一个使用语音跟计算机交互的新时代。但目前技术还有很多限制。究其根本原因,是缺乏对语音的合适编码方案。现有的语音编码方案是:语音被转换成的字符,视觉符号。也就是说,因为古代并未专利技术可以直接处理语音的工具,对语音的记录只能通过将语音转化为文字符号来处理。当然对于使用拼音文字的国家,这个问题基本上是解决了,其文字本来就是对声音的记录。但汉字则不同,因为汉字本身是表 ...
【技术保护点】
【技术特征摘要】
1.一种字体发音确定方法,其特征在于,包括:获取语音波形文件,对所述语音波形文件进行语音文字识别转换,以得到转换后的文字总信息,对所述转换后的文字总信息进行划分,以得到各文字信息;从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符;根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件,以便基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音。2.根据权利要求1所述的字体发音确定方法,其特征在于,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符之前,还包括:创建空白字符集,获取预设的多音字信息和方言信息,并确定出相应的多音词字符和方言字符,按照预设的字符编码规则,为所述多音字字符和所述方言字符创建各编码,并将各所述编码保存至所述空白字符集中的存储区域,以得到字符集。3.根据权利要求2所述的字体发音确定方法,其特征在于,所述从预设字符集中筛选出与所述文字信息相对应的所有编码以及相应的字符,包括:根据所述文字信息遍历所述字符集中的各存储区域,以便从各所述存储区域中筛选出与所述文字信息相对应的所有编码以及相应的字符;其中,所述各存储区域包括多音字存储区域和方言存储区域。4.根据权利要求1至3任一项所述的字体发音确定方法,其特征在于,所述根据所述编码以及相应的字符从预设的字体文件中筛选出目标字体文件,然后根据所述编码从预设的语音文件中筛选出目标语音文件之前,还包括:获取预设的历史文字信息,并为所述历史文字信息添加唯一编码,以形成所述历史文字信息与所述唯一编码之间的映射关系,以得到字体文件,并将各字体类型保存至所述字体文件;获取预设的历史语音发音信息,根据所述唯一编码,为所述唯一编码添加历史语音发音信息,以形成所述唯一编码与所述历史语音发音信息之间的映射关系,以得到语音文件,并将各语音发音类型保存至所述语音文件。5.根据权利要求4所述的字体发音确定方法,其特征在于,所述基于所述目标字体文件和所述目标语音文件确定出与所述语音消息相对应的目标字体和目标发音之后,还包括:根据业务需求从所述字体...
【专利技术属性】
技术研发人员:沈学东,冯立宏,何雨可,向梦甜,陈喆,孙阳洋,童珈琪,张梦銮,孙硕,
申请(专利权)人:苏州曦动健康科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。