【技术实现步骤摘要】
本申请涉及文本分割,具体涉及一种文本分割格式化方法及装置。
技术介绍
1、文本信息是指以文字、数字、符号等形式表达的信息,通常以文本形式存储和传输。文本信息可以包括各种类型的信息,如新闻、小说、博客、电子邮件、短信、社交媒体帖子等。
2、互联网上存在大量的文本信息,这些大量的文本信息被获取到后,由于格式的丢失,会出现所有文字都变成一行的情况,因此难以对这些大量的文本信息进行阅读和编排。
3、现有的文本分割工具只能通过简单的单个符号,比如逗号、句号以及斜线等符号进行文本分割,该分割方式较为简单,无法满足用户的阅读体验和使用需求。
技术实现思路
1、有鉴于此,本申请实施例提供了一种文本分割格式化方法及装置,可以按照自定义的方式,将大量文本进行分割格式化,优化了阅读体验和使用需求。
2、第一方面,本申请提供了一种文本分割格式化方法,所述方法包括:
3、获取原始的未格式化字符串;
4、获取所述未格式化字符串的多个匹配条件,并创建与所述匹配
...【技术保护点】
1.一种文本分割格式化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述匹配条件包括数字匹配条件、自增数字匹配条件、自减数字匹配条件、文字匹配条件、自增文字匹配条件、自减文字匹配条件或者符号匹配条件。
3.根据权利要求2所述的方法,其特征在于,所述逻辑运算关系包括且逻辑运算关系或者或逻辑运算关系;
4.根据权利要求1所述的方法,其特征在于,当所述最终规则中不存在自增条件或自减条件时,所述根据所述最终规则对所述未格式化字符串进行遍历匹配分割,包括:
5.根据权利要求1所述的方法,其特征在于,当
...【技术特征摘要】
1.一种文本分割格式化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述匹配条件包括数字匹配条件、自增数字匹配条件、自减数字匹配条件、文字匹配条件、自增文字匹配条件、自减文字匹配条件或者符号匹配条件。
3.根据权利要求2所述的方法,其特征在于,所述逻辑运算关系包括且逻辑运算关系或者或逻辑运算关系;
4.根据权利要求1所述的方法,其特征在于,当所述最终规则中不存在自增条件或自减条件时,所述根据所述最终规则对所述未格式化字符串进行遍历匹配分割,包括:
5.根据权利要求1所述的方法,其特征在于,当所述最终规则中存在自增条件或自减条件时,所述根据所述最终规则对所述未格式化字符串进行遍历匹配...
【专利技术属性】
技术研发人员:盛利,
申请(专利权)人:镁佳北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。