文本转写方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37634176 阅读:37 留言:0更新日期:2023-05-20 08:54
本发明专利技术提供一种文本转写方法、装置、电子设备及存储介质,涉及信息处理技术领域,该方法包括:获取初始文本,所述初始文本中包括待转写的第一子文本;在转写规则库中查找到与所述第一子文本对应的目标转写规则的情况下,确定所述目标转写规则是否包括标记信息,所述转写规则库中的各转写规则用于表征待转写文本对应的目标文本,所述标记信息用于表征所述第一子文本包括至少两种语义;在所述目标转写规则包括标记信息的情况下,提取所述初始文本的特征信息;基于所述特征信息将所述第一子文本转写为第二子文本。本发明专利技术可以提高文本转写的准确性。准确性。准确性。

【技术实现步骤摘要】
文本转写方法、装置、电子设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种文本转写方法、装置、电子设备及存储介质。

技术介绍

[0002]自然语言领域中,存在诸多希望将非标准形式文本转换成目标语种中标准形式文本的应用场景。以语音合成应用场景为例,在语音合成前端处理中,需要把不规则书写的文本如数字、时间日期、货币单位、特殊符号等准确转换成目标语种的单词,从而保证语音合成的过程中有准确的前端信息输入,得到准确的语音合成结果。以目标语种是中文为例,需要将“123”转写成中文“一百二十三”,将“1/10”转写成中文“十分之一”,将“8:00am”转写成“早上八点钟”等等。
[0003]在现有技术中,通常通过总结并提炼目标语种中特殊符号的转写规律并形成转写资源,该转写资源中包括有多个转写规则,在待转写的文本与转写规则匹配的情况下,则按照匹配成功的转写规则,通过转写模块进行文本转写,得到最终的转写结果。图1为现有技术中文本转写方法的示意框图,如图1所示,例如待转写文本为“这件衬衫的售价为23$”,基于总结转写规律后得到的转写资本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本转写方法,其特征在于,包括:获取初始文本,所述初始文本中包括待转写的第一子文本;在转写规则库中查找到与所述第一子文本对应的目标转写规则的情况下,确定所述目标转写规则是否包括标记信息,所述转写规则库中的各转写规则用于表征待转写文本对应的目标文本,所述标记信息用于表征所述第一子文本包括至少两种语义;在所述目标转写规则包括标记信息的情况下,提取所述初始文本的特征信息;基于所述特征信息将所述第一子文本转写为第二子文本。2.根据权利要求1所述的文本转写方法,其特征在于,所述特征信息包括词特征信息和字符特征信息;所述基于所述特征信息将所述第一子文本转写为第二子文本,包括:将所述词特征信息和所述字符特征信息进行融合,得到融合特征;基于所述融合特征,确定所述第一子文本对应的语义预测类别;基于所述语义预测类别,将所述第一子文本转写为所述第二子文本。3.根据权利要求2所述的文本转写方法,其特征在于,所述方法还包括:基于所述初始文本中的各词语在所述初始文本中的位置和各词语对应的类别,确定所述初始文本对应的注意力特征信息;所述将所述词特征信息和所述字符特征信息进行融合,得到融合特征,包括:将所述词特征信息、所述字符特征信息和所述注意力特征信息进行融合,得到所述融合特征。4.根据权利要求1

3任一项所述的文本转写方法,其特征在于,所述转写规则库中包括用户转写规则和系统转写规则,所述用户转写规则的优先级高于所述系统转写规则的优先级;在转写规则库中查找与所述第一子文本对应的目标转写规则,包括:基于所述转写规则库中各转写规则的优先级,查找与所述第一子文本对应的目标转写规则。5.根据权利要求1

3任一项所述的文本转写方法,其特征在于,在转写规则库中查找与所述第一子文本对应的目标转写规则,包括:确定所述第一子文本对应的目标类别;...

【专利技术属性】
技术研发人员:詹雁方昕朱荣华孟廷吴江照胡国平
申请(专利权)人:合肥智能语音创新发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1