本发明专利技术公开了一种标题分词方法、终端及计算机可读存储介质,所述标题分词方法包括:获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;存储并显示所述第一分词结果。本发明专利技术可以提高用户在进行标题分词时的效率,提升用户的使用体验。
【技术实现步骤摘要】
标题分词方法、终端及计算机可读存储介质
本专利技术涉及数据加工处理
,尤其涉及一种标题分词方法、终端及计算机可读存储介质。
技术介绍
目前,在电商领域,商户在对商品标题进行分词时采用的都是简单的分词软件,达不到理想的分词效果,并且商户在编辑商品名称时,因为商户有很多商品,基本上不会记得某个商品起什么名称合适,需要对商品标题进行查看,然后手动输入商品名称,商户进行标题分词时效率较低。因此,有必要提供一种标题分词方法,以解决上述技术问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种标题分词方法、终端及计算机可读存储介质,旨在解决商户进行标题分词时效率较低的技术问题。为实现上述目的,本专利技术提供一种标题分词方法,所述标题分词方法包括:获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;存储并显示所述第一分词结果。优选地,所述获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本的步骤包括:获取用户输入的标题文本,判断所述标题文本的类型;若所述标题文本的类型为数字信息,则根据预设数据库,判断所述预设数据库中是否存在与所述标题文本对应的第二分词结果;若所述预设数据库中存在与所述标题文本对应的第二分词结果,则在用户界面显示所述第二分词结果;所述获取用户输入的标题文本,判断所述标题文本的类型的步骤之后,还包括:若所述标题文本的类型为文字信息,则根据预设规则对所述标题文本进行过滤处理,生成已过滤文本。优选地,所述获取用户输入的标题文本,判断所述标题文本的类型的步骤之前,还包括:获取用户输入的标题文本,判断所述标题文本的字符数是否大于预设字符数;若所述标题文本的字符数小于或等于预设字符数,则执行:所述根据预设数据库,判断所述预设数据库中是否存在与所述标题文本对应的第二分词结果的步骤;若所述标题文本的字符数大于预设字符数,则执行:所述获取用户输入的标题文本,判断所述标题文本的类型的步骤。优选地,所述获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本的步骤包括:获取用户输入的标题文本,对所述标题文本进行文本识别,确认所述标题文本中的敏感字符;删除所述标题文本中的所述敏感字符,生成已过滤文本。优选地,所述删除所述标题文本中的所述敏感字符,生成已过滤文本的步骤,包括:删除所述标题文本中的所述敏感字符,检测所述已过滤文本的语法,判断所述已过滤文本的语法是否符合预设语法规则;若所述已过滤文本的语法不符合所述预设语法规则,则通过预设纠正算法对所述已过滤文本的语法进行纠正处理,生成已过滤文本。优选地,所述调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果的步骤之后,包括:将所述第一分词结果存入缓存队列中;按照单线程顺序将所述缓存队列中的第一分词结果存入预设文本文件中。优选地,所述存储并显示所述第一分词结果的步骤之后,包括:获取所述第一分词结果各词组的语义;生成与各所述词组的语义相似的近义词词组并显示。优选地,所述存储并显示所述第一分词结果的步骤之后,包括:将所述第一分词结果中各所述词组进行关联并组合,以生成标题简称。本专利技术还提供一种终端,包括处理器、存储器、以及存储在所述存储器上的可被所述处理器执行的计算机程序,其中,所述计算机程序被所述处理器执行时,实现如上述的标题分词方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器执行时,实现如上述的标题分词方法的步骤。本专利技术技术方案中,通过获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;存储并显示所述第一分词结果。可以使用户在进行标题分词时的效率提升。附图说明图1为本专利技术实施例方案中涉及的终端的硬件结构示意图;图2为本专利技术标题分词方法第一实施例的流程示意图;图3为本专利技术标题分词方法第一实施例中步骤S100的流程细化示意图;图4为本专利技术标题分词方法第三实施例的流程示意图;图5为本专利技术标题分词方法第一实施例中步骤S100的流程细化示意图;图6为本专利技术标题分词方法第四实施例中步骤S410的流程细化示意图;图7为本专利技术标题分词方法第六实施例的流程示意图;图8为本专利技术标题分词方法第七实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例涉及的标题分词方法主要应用于终端,该终端可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。参照图1,图1为本专利技术实施例方案中涉及的终端结构示意图。本专利技术实施例中,终端可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及标题分词程序。在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的标题分词程序,并执行标题分词方法的步骤:获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;存储并显示所述第一分词结果。进一步地,所述处理器1001可以调用所述存储器1005中存储的标题分词程序,并执行步骤:...
【技术保护点】
1.一种标题分词方法,其特征在于,所述标题分词方法包括:/n获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;/n调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;/n存储并显示所述第一分词结果。/n
【技术特征摘要】
1.一种标题分词方法,其特征在于,所述标题分词方法包括:
获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本;
调用分词接口将所述已过滤文本发送至与所述分词接口对应的外部服务器,接收所述外部服务器根据所述已过滤文本生成的第一分词结果;
存储并显示所述第一分词结果。
2.如权利要求1所述的标题分词方法,其特征在于,所述获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本的步骤包括:
获取用户输入的标题文本,判断所述标题文本的类型;
若所述标题文本的类型为数字信息,则根据预设数据库,判断所述预设数据库中是否存在与所述标题文本对应的第二分词结果;
若所述预设数据库中存在与所述标题文本对应的第二分词结果,则在用户界面显示所述第二分词结果;
所述获取用户输入的标题文本,判断所述标题文本的类型的步骤之后,还包括:
若所述标题文本的类型为文字信息,则根据预设规则对所述标题文本进行过滤处理,生成已过滤文本。
3.如权利要求2所述标题分词方法,其特征在于,所述获取用户输入的标题文本,判断所述标题文本的类型的步骤之前,还包括:
获取用户输入的标题文本,判断所述标题文本的字符数是否大于预设字符数;
若所述标题文本的字符数小于或等于预设字符数,则执行:所述根据预设数据库,判断所述预设数据库中是否存在与所述标题文本对应的第二分词结果的步骤;
若所述标题文本的字符数大于预设字符数,则执行:所述获取用户输入的标题文本,判断所述标题文本的类型的步骤。
4.如权利要求1所述的标题分词方法,其特征在于,所述获取用户输入的标题文本,根据预设规则对所述标题文本进行过滤处理,生成已过滤文本的步骤包括:
获取用户输入的标题文本,对所述标题文本进行文本...
【专利技术属性】
技术研发人员:李松,
申请(专利权)人:深圳市微购科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。