网页文字朗读方法和系统技术方案

技术编号:6956446 阅读:628 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种网页文字朗读方法,包括根据访问指令中的网页地址获取网页文件;从网页文件提取纯文本数据;将纯文本数据转换为语音数据并播放。本发明专利技术还提供网页文字朗读系统。本发明专利技术提供的网页文字朗读方法和系统,通过获取网页文件,提取网页文件中的纯文本数据,并将纯文本数据转换为语音数据,并播放语音数据,使得用户可以通过听觉浏览网页信息,缓解用户的视觉疲劳。

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及网页文字朗读方法和系统
技术介绍
移动互联网是由移动通信和互联网的融合而产生,可同时提供话音、传真、数据、 图像、多媒体等高品质服务的新一代开放的电信基础网络,是国家信息化建设的重要组成部分。移动互联网能让用户在移动中通过移动设备如手机、个人数码助理(Personal Digital Assistant, PDA)等移动终端随时、随地访问互联网(Internet)。随着移动互联网的高度发展,人们每天都大量的通过手机、个人数码助理、上网本等终端通过移动通信网络浏览网页,而且所浏览的信息量呈现不断高速增长之势。但是由于手机、个人数码助理、上网本等终端屏幕尺寸小,字体小从而极易导致视觉疲劳,而且由于屏幕尺寸小使得显示内容有限,需要不断的滚动屏幕或者翻页操作,使得用户浏览网页时比较麻烦,用户体验很差。
技术实现思路
本专利技术的目的在于提供一种网页文字朗读方法和系统,将网页文字转换为语音数据,使得用户可以通过听觉浏览网页信息。本专利技术提供一种网页文字朗读方法,包括根据访问指令中的网页地址获取网页文件;从网页文件提取纯文本数据;将纯文本数据转换为语音数据并播放。优选地,上述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向网页服务器发送网页获取请求;网页服务器获取与网页地址对应的网页文件,并发送给终端。优选地,上述从网页文件提取纯文本数据的步骤具体包括终端从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述将纯文本数据转换为语音数据并播放的步骤具体包括终端对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;根据韵律变化参数合成标题语音数据或者正文语音数据,并播放。优选地,上述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向网页服务器发送转换请求;网页服务器获取与网页地址对应的网页文件。优选地,上述从网页文件提取纯文本数据的步骤具体包括网页服务器从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述将纯文本数据转换为语音数据并播放的步骤具体包括网页服务器对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;根据韵律变化参数合成标题语音数据或者正文语音数据,并发送给终端;终端播放标题语音数据或者正文语音数据。优 选地,上述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向转换服务器发送转换请求;转换服务器根据网页地址,向网页服务器发送网页获取请求;网页服务器获取与网页地址对应的网页文件, 并发送给转换服务器。优选地,上述从网页文件提取纯文本数据的步骤具体包括转换服务器从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述将纯文本数据转换为语音数据并播放的步骤具体包括转换服务器对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;根据韵律变化参数合成标题语音数据或者正文语音数据,并发送给终端;终端播放标题语音数据或者正文语音数据。本专利技术还提供一种终端,包括控制模块,用于根据访问指令中的网页地址获取网页文件,从网页文件提取纯文本数据;语音合成模块,用于将纯文本数据转换为语音数据; 语音播放模块,用于播放语音数据。优选地,上述控制模块包括获取子模块、提取子模块,以及转换子模块;获取子模块,用于根据网页地址向网页服务器发送网页获取请求,接收网页服务器发送的与网页地址对应的网页文件;提取子模块,用于从网页文件提取网页标题或者网页正文;转换子模块,用于将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述语音合成模块,还用于对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;根据韵律变化参数合成标题语音数据或者正文语音数据。优选地,上述终端还包括界面模块,用于接收包含网页地址的访问指令。本专利技术还提供一种网页文字朗读系统,包括网页服务器和上述终端。本专利技术还提供一种服务器,包括控制模块,用于根据访问指令中的网页地址获取网页文件,从网页文件提取纯文本数据;语音合成模块,用于将纯文本数据转换为语音数据。优选地,上述服务器为网页服务器,上述控制模块包括获取子模块,用于接收终端发送的包含网页地址的转换请求,并获取与网页地址对应的网页文件;提取子模块,用于从网页文件提取网页标题或者网页正文;转换子模块,用于将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述服务器为转换服务器,上述控制模块包括获取子模块,接收终端发送的包含网页地址的转换请求,根据网页地址向网页服务器发送网页获取请求;以及接收网页服务器发送的与网页地址对应的网页文件;提取子模块,用于从网页文件提取网页标题或者网页正文;转换子模块,用于将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。优选地,上述语音合成模块,还用于对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;根据韵律变化参数合成标题语音数据或者正文语音数据。本专利技术还提供一种网页文字朗读系统,包括终端和网页服务器。本专利技术还提供一种网页文字朗读系统,包括终端、网页服务器和转换服务器。本专利技术提供的网页文字朗读方法和系统,通过获取网页文件,提取网页文件中的纯文本数据,并将纯文本数据转换为语音数据,并播放语音数据,使得用户可以通过听觉浏览网页信息,缓解用户的视觉疲劳。同时也可以帮助有视觉障碍的残疾人浏览网页。 附图说明图1为本专利技术网页文字朗读方法一实施例的流程示意图;图2为本专利技术网页文字朗读方法另一实施例的流程示意图;图3为本专利技术网页文字朗读方法又一实施例的流程示意图;图4为本专利技术网页文字朗读系统一实施例的结构示意图;图5为本专利技术网页文字朗读系统另一实施例的结构示意图;图6为本专利技术网页文字朗读系统又一实施例的结构示意图;图7为控制模块的结构示意图。具体实施例方式本专利技术的文字可以是包含标点的字符串或者单个字符,例如可以是单个中文字符,或者是由多个中文字符所组成的词语,还可以是单个英文字母、英文单词、由英文字母与标点符号所组成的网络域名,或者是由阿拉伯数字与标点符号所组成的网址;当然,还可以包括其它形式,对文字定义本专利技术不做限制。总而言之,本专利技术总的技术方案为首先根据访问指令中的网页地址获取网页文件,然后从网页文件提取纯文本数据,最后将纯文本数据转换为语音数据并播放。本专利技术可以由终端从网页服务器获取网页文件后,从网页文件提取纯文本数据, 然后将纯文本数据转换为语音数据并播放;也可以由网页服务器获取网页文件后,从网页文件提取文本数据,并将纯文本数据转换为语音数据,然后传送给终端播放;还可以由转换服务器从网页服务器获取网页文件后提取文本数据,并将纯文本数据转换为语音数据,然后传送给终端播放。本专利技术中的纯文本数据包括标题纯文本数据和正文纯文本数据。终端可通过现有的语音播放器播放标题语音数据或者正文语音数据,或者调用系统提供的播放接口播放标题语音数据或者正文语音数据。下面结合本文档来自技高网...

【技术保护点】
1.一种网页文字朗读方法,其特征在于,包括:根据访问指令中的网页地址获取网页文件;从网页文件提取纯文本数据;将纯文本数据转换为语音数据并播放。

【技术特征摘要】
1.一种网页文字朗读方法,其特征在于,包括 根据访问指令中的网页地址获取网页文件; 从网页文件提取纯文本数据;将纯文本数据转换为语音数据并播放。2.如权利要求1所述的网页文字朗读方法,其特征在于,所述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向网页服务器发送网页获取请求; 网页服务器获取与网页地址对应的网页文件,并发送给终端。3.如权利要求2所述的网页文字朗读方法,其特征在于,所述从网页文件提取纯文本数据的步骤具体包括终端从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。4.如权利要求3所述的网页文字朗读方法,其特征在于,所述将纯文本数据转换为语音数据并播放的步骤具体包括终端对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数; 根据韵律变化参数合成标题语音数据或者正文语音数据,并播放。5.如权利要求1所述的网页文字朗读方法,其特征在于,所述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向网页服务器发送转换请求; 网页服务器获取与网页地址对应的网页文件。6.如权利要求5所述的网页文字朗读方法,其特征在于,所述从网页文件提取纯文本数据的步骤具体包括网页服务器从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。7.如权利要求6所述的网页文字朗读方法,其特征在于,所述将纯文本数据转换为语音数据并播放的步骤具体包括网页服务器对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数; 根据韵律变化参数合成标题语音数据或者正文语音数据,并发送给终端; 终端播放标题语音数据或者正文语音数据。8.如权利要求1所述的网页文字朗读方法,其特征在于,所述根据访问指令中的网页地址获取网页文件的步骤具体包括终端接收包含网页地址的访问指令,根据网页地址向转换服务器发送转换请求; 转换服务器根据网页地址,向网页服务器发送网页获取请求; 网页服务器获取与网页地址对应的网页文件,并发送给转换服务器。9.如权利要求8所述的网页文字朗读方法,其特征在于,所述从网页文件提取纯文本数据的步骤具体包括转换服务器从网页文件提取网页标题或者网页正文;将网页标题或者网页正文,转换为标题纯文本数据或者正文纯文本数据。10.如权利要求9所述的网页文字朗读方法,其特征在于,所述将纯文本数据转换为语音数据并播放的步骤具体包括转换服务器对标题纯文本数据或者正文纯文本数据进行分析,并产生韵律变化参数;...

【专利技术属性】
技术研发人员:王新亮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1