页面数据处理方法、装置、车辆及存储介质制造方法及图纸

技术编号:34822080 阅读:12 留言:0更新日期:2022-09-03 20:33
本公开涉及自动驾驶领域,涉及一种页面数据处理方法、装置、车辆及存储介质,该页面数据处理方法,通过响应于用户的触发操作,获取当前页面对应的目标图像,目标图像包括指定文字方向的文字内容;获取目标图像中该文字内容对应的多个目标文字框区域;根据该指定文字方向确定该多个目标文字框区域中每个目标文字框区域的阅读优先级;按照每个该目标文字框区域的该阅读优先级将该目标文字框区域内的文字内容转换为音频数据,并播放该音频数据,这样通过将页面中的文字内容转换为符合阅读习惯的音频数据进行播放,能够有效减少用户在驾车过程中观看终端屏幕的现象,从而能够有效提升用户体验,降低行车过程中不安全事故的发生概率。率。率。

【技术实现步骤摘要】
页面数据处理方法、装置、车辆及存储介质


[0001]本公开涉及自动驾驶
,尤其涉及一种页面数据处理方法、装置、车辆及存储介质。

技术介绍

[0002]调查显示,很多车祸事故是由于驾驶员驾车过程中的时候玩手机导致的,驾车过程中低头看手机、车机屏幕是非常危险的,不仅会危及驾驶员自身的生命安全,也会对其他车辆和行人带来不必要的危险,更会增加路上其他车辆的行车难度,如何避免驾驶员观看车机屏幕、手机屏幕等终端屏幕成为一个亟待解决的问题。

技术实现思路

[0003]为克服相关技术中存在的问题,本公开提供一种页面数据处理方法、装置、车辆及存储介质。
[0004]根据本公开实施例的第一方面,提供一种页面数据处理方法,包括:
[0005]响应于用户的触发操作,获取当前页面对应的目标图像,所述目标图像包括指定文字方向的文字内容;
[0006]获取所述目标图像中所述文字内容对应的多个目标文字框区域;
[0007]根据所述指定文字方向确定所述多个目标文字框区域中每个所述目标文字框区域的阅读优先级;
[0008]按照每个所述目标文字框区域的所述阅读优先级将所述目标文字框区域内的文字内容转换为音频数据,并播放所述音频数据。
[0009]可选地,所述获取所述目标图像中所述文字内容对应的多个目标文字框区域,包括:
[0010]对所述目标图像进行文字框位置检测,以得到所述文字内容对应的多个文字框位置;
[0011]对所述多个文字框位置进行聚类处理,以得到多个待定文字框区域;
[0012]从所述多个待定文字框区域中确定所述目标文字框区域。
[0013]可选地,所述从所述多个待定文字框区域中确定所述目标文字框区域,包括:
[0014]获取所述目标图像中的图像位置区域;
[0015]在确定所述待定文字框区域与所述图像位置区域不存在交集的情况下,将所述待定文字框区域作为所述目标文字框区域。
[0016]可选地,所述从所述多个待定文字框区域中确定所述目标文字框区域,还包括:
[0017]在确定所述待定文字框区域与所述图像位置区域存在交集的情况下,获取所述待定文字框区域与所述图像位置区域的重叠区域;
[0018]若所述重叠区域大于或者等于预设重叠阈值的情况下,将存在交集的所述待定文字框区域作为所述目标文字框区域;
[0019]若所述重叠区域小于所述预设重叠阈值的情况下,将存在交集的所述待定文字框区域作为非目标文字框区域。
[0020]可选地,所述指定文字方向包括水平文字方向和垂直文字方向,所述根据所述指定文字方向确定所述多个目标文字框区域中每个所述目标文字框区域的阅读优先级,包括:
[0021]获取每个所述目标文字框区域对应标志点的目标位置,其中,在所述指定文字方向为所述水平文字方向的情况下,所述标志点为所述目标文字框区域的左上角顶点,在所述指定文字方向为所述垂直文字方向的情况下,所述标志点为所述目标文字框区域的右上角顶点;
[0022]根据所述多个目标文字框区域中每个所述目标文字框区域对应的所述目标位置确定每个所述目标文字框区域的所述阅读优先级。
[0023]可选地,所述根据所述多个目标文字框区域中每个所述目标文字框区域对应的所述目标位置确定每个所述目标文字框区域的所述阅读优先级,包括:
[0024]在所述指定文字方向为所述水平文字方向的情况下,将所述多个目标文字框区域对应的多个所述目标位置中,位于最顶端,且位于最左侧的所述目标位置对应的所述目标文字框区域作为优先级最高的目标文字框区域;
[0025]在所述指定文字方向为所述垂直文字方向的情况下,将所述多个目标文字框区域对应的多个所述目标位置中,位于最顶端,且位于最右侧的所述目标位置对应的所述目标文字框区域作为优先级最高的目标文字框区域;
[0026]根据所述优先级最高的目标文字框区域确定所述多个目标文字框区域中除所述优先级最高的目标文字框区域之外其他所述目标文字框区域对应的阅读优先级。
[0027]可选地,所述根据所述优先级最高的目标文字框区域确定所述多个目标文字框区域中除所述优先级最高的目标文字框区域之外其他所述目标文字框区域对应的阅读优先级,包括:
[0028]将所述优先级最高的目标文字框区域作为当前文字框区域;
[0029]在所述指定文字方向为所述水平文字方向的情况下,若确定所述当前文字框区域的下侧存在所述目标文字框区域,则获取所述当前文字框区域内的第一文字内容与下侧相邻的所述目标文字框区域内的第二文字内容的第一连贯度;
[0030]若确定所述当前文字框区域的右侧存在所述目标文字框区域,则获取所述当前文字框区域内的第一文字内容与右侧相邻的所述目标文字框区域内的第三文字内容的第二连贯度;
[0031]将所述当前文字框区域对应阅读优先级的下一优先级作为所述第一连贯度与所述第二连贯度中较大者对应目标文字框区域的阅读优先级;
[0032]将所述第一连贯度与所述第二连贯度中较大者对应的目标文字框区域作为更新后的当前文字框区域,并再次执行确定所述当前文字框区域的下侧是否存在所述目标文字框区域和确定所述当前文字框区域的右侧是否存在所述目标文字框区域的步骤,直至在确定所述当前文字框区域的下侧和右侧均不存在所述目标文字框区域的情况下,确定获取到了每个所述目标文字框区域对应的阅读优先级。
[0033]可选地,所述根据所述优先级最高的目标文字框区域确定所述多个目标文字框区
域中除所述优先级最高的目标文字框区域之外其他所述目标文字框区域对应的阅读优先级,包括:
[0034]在所述指定文字方向为所述垂直文字方向的情况下,若确定所述当前文字框区域的下侧存在所述目标文字框区域,则获取所述第一连贯度;
[0035]若确定所述当前文字框区域的左侧存在所述目标文字框区域,则获取所述第一文字内容与左侧相邻的所述目标文字框区域内的第四文字内容的第三连贯度;
[0036]将所述当前文字框区域对应阅读优先级的下一优先级作为所述第一连贯度与所述第三连贯度中较大者对应的阅读优先级;
[0037]将所述第一连贯度与所述第三连贯度中较大者对应的目标文字框区域作为更新后的当前文字框区域,并执行确定所述当前文字框区域的下侧是否存在所述目标文字框区域和确定所述当前文字框区域的左侧是否存在所述目标文字框区域的步骤,直至在确定所述当前文字框区域的下侧和左侧均不存在所述目标文字框区域的情况下,确定获取到了每个所述目标文字框区域对应的阅读优先级。
[0038]根据本公开实施例的第二方面,提供一种页面数据处理装置,包括:
[0039]第一获取模块,被配置为响应于用户的触发操作,获取当前页面对应的目标图像,所述目标图像包括指定文字方向的文字内容;
[0040]第二获取模块,被配置为获取所述目标图像中所述文字内容对应的多个目标文字框区域;
[0041]确定模块,被配置为根据所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种页面数据处理方法,其特征在于,包括:响应于用户的触发操作,获取当前页面对应的目标图像,所述目标图像包括指定文字方向的文字内容;获取所述目标图像中所述文字内容对应的多个目标文字框区域;根据所述指定文字方向确定所述多个目标文字框区域中每个所述目标文字框区域的阅读优先级;按照每个所述目标文字框区域的所述阅读优先级将所述目标文字框区域内的文字内容转换为音频数据,并播放所述音频数据。2.根据权利要求1所述的方法,其特征在于,所述获取所述目标图像中所述文字内容对应的多个目标文字框区域,包括:对所述目标图像进行文字框位置检测,以得到所述文字内容对应的多个文字框位置;对所述多个文字框位置进行聚类处理,以得到多个待定文字框区域;从所述多个待定文字框区域中确定所述目标文字框区域。3.根据权利要求2所述的方法,其特征在于,所述从所述多个待定文字框区域中确定所述目标文字框区域,包括:获取所述目标图像中的图像位置区域;在确定所述待定文字框区域与所述图像位置区域不存在交集的情况下,将所述待定文字框区域作为所述目标文字框区域。4.根据权利要求3所述的方法,其特征在于,所述从所述多个待定文字框区域中确定所述目标文字框区域,还包括:在确定所述待定文字框区域与所述图像位置区域存在交集的情况下,获取所述待定文字框区域与所述图像位置区域的重叠区域;若所述重叠区域大于或者等于预设重叠阈值的情况下,将存在交集的所述待定文字框区域作为所述目标文字框区域;若所述重叠区域小于所述预设重叠阈值的情况下,将存在交集的所述待定文字框区域作为非目标文字框区域。5.根据权利要求1

4任一项所述的方法,其特征在于,所述指定文字方向包括水平文字方向和垂直文字方向,所述根据所述指定文字方向确定所述多个目标文字框区域中每个所述目标文字框区域的阅读优先级,包括:获取每个所述目标文字框区域对应标志点的目标位置,其中,在所述指定文字方向为所述水平文字方向的情况下,所述标志点为所述目标文字框区域的左上角顶点,在所述指定文字方向为所述垂直文字方向的情况下,所述标志点为所述目标文字框区域的右上角顶点;根据所述多个目标文字框区域中每个所述目标文字框区域对应的所述目标位置确定每个所述目标文字框区域的所述阅读优先级。6.根据权利要求5所述的方法,其特征在于,所述根据所述多个目标文字框区域中每个所述目标文字框区域对应的所述目标位置确定每个所述目标文字框区域的所述阅读优先级,包括:在所述指定文字方向为所述水平文字方向的情况下,将所述多个目标文字框区域对应
的多个所述目标位置中,位于最顶端,且位于最左侧的所述目标位置对应的所述目标文字框区域作为优先级最高的目标文字框区域;在所述指定文字方向为所述垂直文字方向的情况下,将所述多个目标文字框区域对应的多个所述目标位置中,位于最顶端,且位于最右侧的所述目标位置对应的所述目标文字框区域作为优先级最高的目标文字框区域;根据所述优先级最高的目标文字框区域确定所述多个目标文字框区域中除所述优先级最高的目标文字框区域之外其他所述目标文字框区域对应的阅读优先级。7.根据权利要求6所述的方法,其特征在于,所述根据所述优先级最高的目标文字框区域确定所述多个目标文字框区...

【专利技术属性】
技术研发人员:张琼
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1