富文本处理方法、装置、服务器及计算机可读介质制造方法及图纸

技术编号:20916896 阅读:20 留言:0更新日期:2019-04-20 09:46
本发明专利技术实施例的方面涉及富文本处理方法、装置、服务器及计算机可读介质。富文本处理方法包括:结构化步骤,对富文本进行结构化处理,得到包括节点对象的第一结构化对象;打捞步骤,根据预设的目标内容,对所述第一结构化对象进行打捞,得到打捞的目标内容,根据所述打捞的目标内容,对第一结构化对象进行处理,得到第二结构化对象;以及存储步骤,序列化所述第二结构化对象,并对序列化后的第二结构化对象进行存储。通过本发明专利技术实施例,可实现包括节点对象的结构化数据在存储前进行目标内容的打捞,提升页面加载速度,提升用户体验。

Rich Text Processing, Devices, Servers and Computer Readable Media

Aspects of embodiments of the present invention relate to rich text processing methods, devices, servers and computer readable media. Rich text processing methods include: structured steps, structured processing of rich text, get the first structured object including node objects; salvage steps, according to the preset target content, salvage the first structured object, get the salvage target content, according to the salvage target content, process the first structured object and get the second structure. The second structured object is serialized, and the second structured object is stored after serialization. According to the embodiment of the present invention, the structured data including node objects can be salvaged for the target content before storage, and the loading speed of pages can be improved, and the user experience can be improved.

【技术实现步骤摘要】
富文本处理方法、装置、服务器及计算机可读介质
本专利技术实施例涉及互联网
,尤其涉及富文本数据的处理方法、装置、服务器及计算机可读介质。
技术介绍
富文本是一种包含HTML标签,支持丰富格式的文本,比如文字效果、文字链接等,对用户而言,观感更好。目前,网络技术为用户提供多种平台,比如:网站、手机上的APP、微信、以及微信上的小程序等,以供用户发表各类信息,如评价产品、评价服务、发布自己的体验、或者发布照片等富文本内容。用户通常通过浏览电商平台发布的富文本来获取自己需要的信息,在用户浏览富文本的过程中,为了帮助用户快速地获取需要的信息,精准的为用户匹配最合适的商家,需要对用户创作的富文本在发布前,对富文本进行目标内容的打捞,再对富文本内容进行展示。通常,目标内容会根据电商平台上可提供服务的商家、商家展示的产品、服务或者用户的兴趣点等,进行预设。当用户浏览被打捞后的富文本时,可以快速的获取到自己感兴趣的目标内容的链接,从而节省客户时间,提升用户体验。例如,用户在旅游电商平台发布了一段富文本游记,旅游电商需要对平台中富文本的“目的地”“兴趣点”“超链接”等目标内容进行打捞,针对该游记,得到打捞的信息有目的地如“东京”,当其他用户浏览该游记,又想了解“东京”时,可以直接点击“东京”,就可以跳转到东京的主页。现有技术中,针对富文本中目标内容的打捞是在富文本展示过程中进行,然而在内容展示过程中进行目标内容的打捞,严重影响了页面加载速度,降低了用户体验。
技术实现思路
本专利技术实施例提供的富文本的处理方法、装置、服务器及计算机可读介质,可对富文本进行结构化处理,得到包括节点对象的结构化对象,针对包括节点对象的结构化数据可实现在存储前进行目标内容的打捞,进而提升页面加载速度,提升用户体验。本专利技术实施例的一方面提供了富文本处理方法,该方法包括结构化步骤,对富文本进行结构化处理,得到包括节点对象的第一结构化对象;打捞步骤,根据预设的目标内容,对第一结构化对象进行打捞,得到打捞的目标内容,根据打捞的目标内容,对第一结构化对象进行处理,得到第二结构化对象;以及存储步骤,序列化第二结构化对象,并对序列化后的第二结构化对象进行存储。一种可能的实施例中,结构化步骤包括:获取富文本的标签以及与标签对应的标签内容;将富文本的标签替换为预设的节点标识;将标签对应的标签内容存储至与预设的节点标识对应的节点内容里,得到由节点标识与节点内容组成的节点对象;以及将节点对象有序的存储,得到第一结构化对象。另一种可能的实施例中,结构化步骤包括:获取富文本的标签以及与标签对应的标签内容;将富文本的标签替换为预设的节点标识;根据标签内容与富文本标识,获取标签内容与富文本标识的关联标识,将标签内容与富文本标识的关联标识,存储至与预设的节点标识对应的节点内容里,得到包括节点标识与节点内容的节点对象。可能的实施例中,富文本为经过过滤得到的富文本。又一种可能的实施例中,在结构化步骤中,对富文本标签确定节点标识,其中,节点标识与富文本标签为一一对应关系。一种可能的实施例中,打捞步骤包括:获取要打捞的目标内容;以及根据打捞的目标内容,遍历第一结构化对象里的节点对象,得到打捞的目标内容。另一种可能的实施例中,打捞步骤包括:确定第一结构化对象中得到打捞目标内容的打捞节点对象;将打捞节点对象的节点内容,以目标内容为基准,分为位于目标内容前端的前端节点内容、目标内容、以及位于目标内容的后端的后端节点内容;将前端节点内容、目标内容、后端节点内容分别与对应节点标识相关联,得到依次排列的前端节点对象、目标内容节点对象、后端节点对象;将打捞节点对象替换为前端节点对象、目标内容节点对象、后端节点对象,并与第一结构化对象中其他节点对象有序的存储,得到第二结构化对象。一种可能的实施例中,打捞步骤包括:确定第一结构化对象中得到打捞目标内容的打捞节点对象;当打捞节点对象中具有多个打捞目标内容时,分别以各自的打捞目标内容为基准,将打捞节点内容依次划分为多个节点内容和多个打捞目标内容,并将多个节点内容和多个打捞目标内容分别与对应节点标识相关联,得到依次排列的包括多个节点对象和多个目标内容节点对象的节点对象,并用所得到的依次排列的节点对象替换打捞节点对象,并与第一结构化对象中其他节点对象有序的存储,得到第二结构化对象。另一种可能的实施例中,在存储步骤之后还包括:解析步骤,用于对序列化后的第二结构化对象进行反向解析,得到解析后用于展示的富文本内容。本专利技术实施例的另一个方面提供了富文本处理装置,该装置包括结构化单元,打捞单元和序列化单元。其中,结构化单元,用于对富文本进行结构化处理,得到包括节点对象的第一结构化对象。打捞单元,用于根据预设的目标内容,对第一结构化对象进行打捞,得到打捞的目标内容;根据打捞的目标内容,对第一结构化对象进行处理,得到第二结构化对象。序列化单元,用于序列化第二结构化对象,并对序列化后的第二结构化对象进行存储。一种可能的实施例中,结构化单元用于:获取富文本的标签以及与标签对应的标签内容;将富文本的标签替换为预设的节点标识;将标签对应的标签内容存储至与预设的节点标识对应的节点内容里,得到由节点标识与节点内容组成的节点对象;以及将节点对象有序的存储,得到第一结构化对象。另一种可能的实施例中,结构化单元用于:获取富文本的标签以及与标签对应的标签内容;将富文本的标签替换为预设的节点标识;根据标签内容与富文本标识,获取标签内容与富文本标识的关联标识;将标签内容与富文本标识的关联标识,存储至与预设的节点标识对应的节点内容里,得到包括节点标识与节点内容的节点对象。可能的实施例中,富文本为经过过滤得到的富文本。又一种可能的实施例中,结构化单元用于对富文本标签确定节点标识,其中,节点标识与富文本标签为一一对应关系。一种可能的实施例中,打捞单元用于:获取要打捞的目标内容;以及根据打捞的目标内容,遍历第一结构化对象里的节点对象,得到打捞的目标内容。另一种可能的实施例中,打捞单元用于:确定第一结构化对象中得到打捞目标内容的打捞节点对象;将打捞节点对象的节点内容,以目标内容为基准,分为位于目标内容前端的前端节点内容、目标内容、以及位于目标内容的后端的后端节点内容;将前端节点内容、目标内容、后端节点内容分别与对应节点标识相关联,得到依次排列的前端节点对象、目标内容节点对象、后端节点对象;将打捞节点对象替换为前端节点对象、目标内容节点对象、后端节点对象,并与第一结构化对象中其他节点对象有序的存储,得到第二结构化对象。又一种可能的实施例中,打捞单元用于:确定第一结构化对象中得到打捞目标内容的打捞节点对象;当打捞节点对象中具有多个打捞目标内容时,分别以各自的打捞目标内容为基准,将打捞节点内容依次划分为多个节点内容和多个打捞目标内容,并将多个节点内容和多个打捞目标内容分别与对应节点标识相关联,得到依次排列的包括多个节点对象和多个目标内容节点对象的节点对象,并用所得到的依次排列的节点对象替换打捞节点对象,并与第一结构化对象中其他节点对象有序的存储,得到第二结构化对象。一种可能的实施例中,序列化单元还用于:对所述序列化后的第二结构化对象进行反向解析,得到解析后用于展示的富文本内容。本专利技术实施例提供的富文本本文档来自技高网...

【技术保护点】
1.一种富文本处理方法,其中,所述方法包括:结构化步骤,对富文本进行结构化处理,得到包括节点对象的第一结构化对象;打捞步骤,根据预设的目标内容,对所述第一结构化对象进行打捞,得到打捞的目标内容,根据所述打捞的目标内容,对第一结构化对象进行处理,得到第二结构化对象;以及存储步骤,序列化所述第二结构化对象,并对序列化后的第二结构化对象进行存储。

【技术特征摘要】
1.一种富文本处理方法,其中,所述方法包括:结构化步骤,对富文本进行结构化处理,得到包括节点对象的第一结构化对象;打捞步骤,根据预设的目标内容,对所述第一结构化对象进行打捞,得到打捞的目标内容,根据所述打捞的目标内容,对第一结构化对象进行处理,得到第二结构化对象;以及存储步骤,序列化所述第二结构化对象,并对序列化后的第二结构化对象进行存储。2.根据权利要求1所述的方法,其中,所述结构化步骤包括:获取富文本的标签以及与所述标签对应的标签内容;将所述富文本的标签替换为预设的节点标识;将所述标签对应的标签内容存储至与所述预设的节点标识对应的节点内容里,得到由节点标识与节点内容组成的节点对象;以及将所述节点对象有序的存储,得到所述第一结构化对象。3.根据权利要求1所述的方法,其中,所述结构化步骤包括:获取富文本的标签以及与所述标签对应的标签内容;将所述富文本的标签替换为预设的节点标识;根据所述标签内容与富文本标识,获取所述标签内容与所述富文本标识的关联标识;将所述标签内容与富文本标识的关联标识,存储至与所述预设的节点标识对应的节点内容里,得到包括节点标识与节点内容的节点对象。4.根据权利要求1所述的方法,其中,所述富文本为经过过滤得到的富文本。5.根据权利要求1至3中任一项所述的方法,其中,在结构化步骤中,对富文本标签确定节点标识,所述节点标识与所述富文本标签为一一对应关系。6.根据权利要求1所述的方法,其中,所述打捞步骤包括:获取要打捞的目标内容;以及根据所述打捞的目标内容,遍历所述第一结构化对象里的节点对象,得到打捞的目标内容。7.根据权利要求6所述的方法,其中,所述打捞步骤包括:确定第一结构化对象中得到所述打捞目标...

【专利技术属性】
技术研发人员:韩志普汪洋束锋华
申请(专利权)人:北京创鑫旅程网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1