一种中文人名播报方法及装置制造方法及图纸

技术编号:12388986 阅读:55 留言:0更新日期:2015-11-25 22:19
本发明专利技术公开了一种中文人名播报方法及装置,所述方法包括:在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。本发明专利技术能够实现中文人名的准确播报。

【技术实现步骤摘要】

本专利技术涉及移动通讯领域,特别涉及一种中文人名播报方法及相关的装置。
技术介绍
词法分析:是计算机科学中将字符序列转换为单词序列的过程。进行词法分析的程序或者函数叫做词法分析器,也叫扫描器。供语法分析器调用。由于汉语不像英文单词是以空格分开的,因此词法分析一般都是结合语义分析技术相结合使用。句法分析:所谓句法分析(Parsing)就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。句法分析现在主要的应用在于中文信息处理,如机器翻译等。它是语块分析(chunking)思想的一个直接实现,语块分析通过识别出高层次的结构单元来简化句子的描述。从不同的句子中找到语块规律的一条途径是学习一种语法,这种语法能够解释所找到的分块结构。这属于语法归纳的范畴。语音合成(TextToSpeech,TTS):语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放。目前汉语人名中普遍存在多音字,有些多音字的发音又是姓氏中所独有的,例如,曾(zeng)沈(shen)翟(zhai)单(shan),在一些常用词汇中的读音为曾(ceng)沈(chen)翟(di)单(dan)。另外一些历史人名中有些特殊的发音,例如刘禅(shan),关云长(chang),贾平凹(wa),在一些常用词汇中的读音为禅(chan)长(zhang)凹(ao)。对于姓名的多音字,TTS播报引擎基本上按照常用词汇的发音进行播报,经常播出让人啼笑皆非的效果,例如人名:曾(ceng)一庭。
技术实现思路
本专利技术的目的在于提供一种中文人名播报方法及装置,通过对待播报文本字符串中的人名字符串进行多音字读音标识,并按照所标识的多音字读音播报人名字符串,解决中文人名中多音字播报不准确的问题。根据本专利技术的一个方面,提供了一种中文人名播报方法,包括:终端侧将含有人名字符串的待播报文本字符串发送至网络侧;接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;按照所述读音字符串播报所述人名字符串。根据本专利技术的另一个方面,提供了一种中文人名播报方法,包括:在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。优选地,在预置的读音数据库中,搜索待播报文本字符串中的人名字符串的步骤之前,还包括:网络侧接收来自终端侧的待播报文本字符串;对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。优选地,所述读音数据库包括历史人名发音知识库和/或姓氏发音知识库,网络侧在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。优选地,所述的通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识的步骤包括:网络侧在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串;将所述读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读音。根据本专利技术的另一个方面,提供了一种中文人名播报装置,包括:终端侧收发模块,用于将含有人名字符串的待播报文本字符串发送至网络侧,并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;终端侧播报模块,用于按照所述读音字符串播报所述人名字符串。根据本专利技术的另一方面,提供了一种中文人名播报装置,包括:网络侧搜索模块,用于在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;网络侧标识模块,用于通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;网络侧发送模块,用于将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。优选地,还包括:网络侧接收模块,用于在所述网络侧搜索模块搜索待播报文本字符串中的人名字符串之前,接收来自终端侧的待播报文本字符串;网络侧分析模块,用于对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。优选地,所述读音数据库包括历史人名发音知识库和/或姓氏发音知识库,所述网络侧搜索模块在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。优选地,所述网络侧标识模块在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串,并将所提取的读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读音。与现有技术相比较,本专利技术的有益效果在于:本专利技术通过文本中的语义解析出人名并标识,从而达到在终端侧TTS播报的时候可以根据标识将人名中的多音字按照正确发音播报的目的。附图说明图1是本专利技术提供的终端侧的中文人名播报方法原理框图;图2是本专利技术提供的终端侧的中文人名播报装置框图;图3是本专利技术提供的网络侧的中文人名播报方法原理框图;图4是本专利技术提供的网络侧的中文人名播报装置框图;图5(a)是本专利技术实施例提供的历史人名读音知识库图表;图5(b)是本专利技术实施例提供的姓氏读音知识库图表;图6是本专利技术实施例提供的“曾一庭看《三国演义》这部小说,他非常喜欢关云长这个角色。”经过句法分析和语法分析后所得出的两颗语法树;图7是本专利技术实施例提供的中文人名播报流程图。具体实施方式以下结合附图对本专利技术的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1是本专利技术提供的终端侧的中文人名播报方法原理框图,如图1所示,步骤包括:步骤S101:终端侧将含有人名字符串的待播报文本字符串发送至网络侧,步骤S102:接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串人名字符串。步骤S103:按照所述读音字符串播报所述人名字符串。为实现对中文人名的正确播报,终端侧利用网络侧对人名字符串进行处理,具体地说,若所述人名中存在多音字,则网络侧对该多音字进行读音标识,从而使得终端侧的语音合成引擎能够按照所标识的读音正确播报所述人本文档来自技高网
...

【技术保护点】
一种中文人名播报方法,其特征在于,包括:终端侧将含有人名字符串的待播报文本字符串发送至网络侧;接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;按照所述读音字符串播报所述人名字符串。

【技术特征摘要】
1.一种中文人名播报方法,其特征在于,包括:
终端侧将含有人名字符串的待播报文本字符串发送至网络侧;
接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;
按照所述读音字符串播报所述人名字符串。
2.一种中文人名播报方法,其特征在于,包括:
在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;
通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;
将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述
读音字符串播报所述人名字符串。
3.根据权利要求2所述的方法,其特征在于,在预置的读音数据库中,搜
索待播报文本字符串中的人名字符串的步骤之前,还包括:
网络侧接收来自终端侧的待播报文本字符串;
对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人
名字符串。
4.根据权利要求2或3所述的方法,其特征在于,所述读音数据库包括历
史人名发音知识库和/或姓氏发音知识库,网络侧在所述历史人名发音知识库和/
或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。
5.根据权利要求4所述的方法,其特征在于,所述的通过所述读音数据库
中的读音字符串对所述人名字符串进行读音标识的步骤包括:
网络侧在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述
人名字符串的读音字符串;
将所述读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名
的读音。
6.一种中文人名播报装置,其特征在于,包括...

【专利技术属性】
技术研发人员:刘伟
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1