文本处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:18668148 阅读:19 留言:0更新日期:2018-08-14 20:36
本申请涉及一种文本处理方法、系统、计算机设备和存储介质。所述方法包括:获取待处理文本;将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置;根据所述待处理文本确定与所述目标词条对应的词条信息;根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接;当接收到终端发送的对所述超链接的查阅指令时,将所述词条信息发送至所述终端。采用本方法能够节约了浏览者查询目标词条的时间,因此提高了文本的信息提供效率。

Text processing method, device, computer equipment and storage medium

The application relates to a text processing method, a system, a computer device and a storage medium. The method comprises: acquiring the text to be processed, inputting the text to be processed into a preset text matching model, obtaining the matched target entry and the entry position of the target entry in the text to be processed, determining the entry information corresponding to the target entry according to the text to be processed, and according to the entry message. The message and the entry position convert the target entry in the text to a hyperlink, and when a terminal receives a lookup instruction for the hyperlink, the entry information is transmitted to the terminal. This method can save the time of searching the target entries, so it can improve the efficiency of text information provision.

【技术实现步骤摘要】
文本处理方法、装置、计算机设备和存储介质
本申请涉及互联网
,特别是涉及一种文本处理方法、装置、计算机设备和存储介质。
技术介绍
随着物质生活水平的提高,在人们对文化产品、文化服务表现出越来越高的追求的同时,也越来越愿意将经历与感想分享给大众。由此衍生出许多美食点评或旅游攻略的网站,用户可以在网站平台发表文本、图片等信息供人阅览。然而,传统的信息共享网站平台上通常会充斥着大篇幅的文本,使得浏览者难以获取关键信息。且当浏览者遇到不熟悉的行业词条时,还需要再通过搜索引擎进行查询,浏览者需要耗费大量的时间进行阅读,文本阅读的便捷性不高,使得降低浏览者的浏览兴趣,从而导致文本的信息提供效率较低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高文本的信息提供效率的文本处理方法、装置、计算机设备和存储介质。一种文本处理方法,所述方法包括:获取待处理文本;将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置;根据所述待处理文本确定与所述目标词条对应的词条信息;根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接;当接收到终端发送的对所述超链接的查阅指令时,将所述词条信息发送至所述终端。在其中一个实施例中,所述将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置,包括:将所述待处理文本输入预设的文本匹配模型;所述文本匹配模型通过预设的词条树和执行函数构成;根据所述执行函数将所述待处理文本与所述预设的词条树进行匹配,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置。在其中一个实施例中,所述根据所述待处理文本确定与所述目标词条对应的词条信息,包括:判断所述目标词条是否对应多个主题类别的词条信息;若是,则根据所述词条位置确定所述目标词条的主题类别;将属于所确定的主题类别的词条信息作为与所述目标词条对应的词条信息。在其中一个实施例中,所述根据所述词条位置确定所述目标词条的主题类别,包括:根据所述词条位置,获取所述待处理文本中所述目标词条的前续语句和后续语句;提取所述前续语句和所述后续语句中的语句关键词;确定所述语句关键词所属的主题类别,并将所确定的主题类别作为所述目标词条的主题类别。在其中一个实施例中,所述词条位置包括起始位置和结束位置;所述根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接,包括:根据所述词条信息在所述目标词条所对应的起始位置插入起始标签;在所述目标词条所对应的结束位置插入结束标签;根据所述起始标签和所述结束标签将所述目标词条转换成超链接;所述超链接用于连接所述词条信息。在其中一个实施例中,所述将所述词条信息发送至所述终端,包括:将所述词条信息发送至所述终端;所述词条信息用于在所述终端生成相应的词条弹出框。在其中一个实施例中,所述词条弹出框中包含资源控件;在所述将所述词条信息发送至所述终端之后,还包括:统计预设时长内终端发送的资源链接请求的请求数量;根据所述指令数量生成资源链接响应;所述资源链接响应用于指示所述终端根据所述指令数量改变所述资源控件的形状。一种文本处理装置,所述装置包括:待处理文本获取模块,用于获取待处理文本;目标词条匹配模块,用于将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置;词条信息确定模块,用于根据所述待处理文本确定与所述目标词条对应的词条信息;超链接生成模块,用于根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接;词条信息发送模块,用于当接收到终端发送的对所述超链接的查阅指令时,将所述词条信息发送至所述终端。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述文本处理方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述文本处理方法的步骤。上述文本处理方法、装置、计算机设备和存储介质,在获取待处理文本之后,通过预设的文本匹配模型得到待处理文本中存在的目标词条及目标词条的词条位置。确定与目标词条对应的词条信息之后,可根据词条信息将目标词条转换为超链接,使得目标词条能够与词条信息具有连接关系。当接收到终端发送的对超链接的查阅指令时,将词条信息发送至终端,使得在浏览者阅读待处理文本时能够及时获得目标词条相应的词条信息,且通过根据待处理文本确定与目标词条对应的词条信息,提高了提供相应的词条信息的精准度,节约了浏览者查询目标词条的时间,因此提高了文本的信息提供效率。附图说明图1为一个实施例中文本处理方法的应用场景图;图2为一个实施例中文本处理方法的流程示意图;图3为一个实施例中多个目标词条构成的词条树示意图;图4A为一个实施例中终端通过超链接显示词条信息的示意图;图4B为另一个实施例中终端通过超链接显示词条信息的示意图;图4C为又一个实施例中终端通过超链接显示词条信息的示意图;图5为一个实施例中文本处理装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的文本处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。比如说,终端102可将待处理文本发送至服务器104进行存储;服务器104可在接收到终端102发送的对超链接的查阅指令时,将词条信息发送至终端102等。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种文本处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤202,获取待处理文本。待处理文本是指需要进行文本处理的文本。待处理文本可由中文字符、英文字母、标点符号及阿拉伯数字等其中一种或多种组成,但不限于此。待处理文本可为预存于数据库中的文本,也可为终端发送的文本,还可为通过文本采集脚本在预设网页上采集得到的文本。步骤204,将待处理文本输入预设的文本匹配模型,得到匹配的目标词条及目标词条在待处理文本中的词条位置。文本匹配模型是指用于检测文本中一个或多个目标词条的模型。目标词条是指待处理文本中需要进行匹配的词条。词条位置是指目标词条在待处理文本中的位置。比如说,针对待处理文本“今天深圳的天气晴朗”,预设的文本匹配模型输出的目标词条可为“深圳”,位置为“3~4”。在一个实施例中,目标词条可为POI(PointofInterest,兴趣点,是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。)词条。可通过搜集各个领域的POI词条,包括简称、全称、别称等,还可对POI词条进行分类分库存储。比如说可搜集旅游行业的POI词条,可将上海的简称沪和别称申城都进行本文档来自技高网...

【技术保护点】
1.一种文本处理方法,所述方法包括:获取待处理文本;将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置;根据所述待处理文本确定与所述目标词条对应的词条信息;根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接;当接收到终端发送的对所述超链接的查阅指令时,将所述词条信息发送至所述终端。

【技术特征摘要】
1.一种文本处理方法,所述方法包括:获取待处理文本;将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置;根据所述待处理文本确定与所述目标词条对应的词条信息;根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条转换成超链接;当接收到终端发送的对所述超链接的查阅指令时,将所述词条信息发送至所述终端。2.根据权利要求1所述的方法,其特征在于,所述将所述待处理文本输入预设的文本匹配模型,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置,包括:将所述待处理文本输入预设的文本匹配模型;所述文本匹配模型通过预设的词条树和执行函数构成;根据所述执行函数将所述待处理文本与所述预设的词条树进行匹配,得到匹配的目标词条及所述目标词条在所述待处理文本中的词条位置。3.根据权利要求1所述的方法,其特征在于,所述根据所述待处理文本确定与所述目标词条对应的词条信息,包括:判断所述目标词条是否对应多个主题类别的词条信息;若是,则根据所述词条位置确定所述目标词条的主题类别;将属于所确定的主题类别的词条信息作为与所述目标词条对应的词条信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述词条位置确定所述目标词条的主题类别,包括:根据所述词条位置,获取所述待处理文本中所述目标词条的前续语句和后续语句;提取所述前续语句和所述后续语句中的语句关键词;确定所述语句关键词所属的主题类别,并将所确定的主题类别作为所述目标词条的主题类别。5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述词条位置包括起始位置和结束位置;所述根据所述词条信息和所述词条位置将所述待处理文本中的所述目标词条...

【专利技术属性】
技术研发人员:艾明
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1