文本处理方法及装置制造方法及图纸

技术编号:24353546 阅读:35 留言:0更新日期:2020-06-03 02:05
本公开实施例提供一种文本处理方法及装置,该方法包括:获取第一句子的关键词和热点词,所述热点词为预设时段内使用频率大于第一阈值的词汇;根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,所述关键词中的所述交集字符在所述第一句子中的索引、与所述热点词中的所述交集字符在所述第一句子中的索引相同;根据所述交集字符显示所述第一句子,所述交集字符的显示方式与所述第一句子中除所述交集字符外的其他字符的显示方式不同。本公开实施例能够迅速获取关键词和热点词在文本中的相互关系。

Text processing method and device

【技术实现步骤摘要】
文本处理方法及装置
本公开实施例涉及信息处理
,尤其涉及一种文本处理方法及装置。
技术介绍
随着计算机技术和互联网技术的发展,大量的文本数据需要进行展示,其中,文本数据是指信息载体的数据信息。例如:文本数据可以为广告、文章等。文本数据中通常包括关键词和热点词,其中,关键词为与文本数据中含义紧密相关的词汇,热点词为一定时期内的高频词汇。热点词和关键词之间可能互不相关,也可能具有交集,根据热点词和关键词之间的关系能够帮助用户快速抓取文本数据的关键信息。例如,在广告投放领域,根据广告文本中关键词和热点词的关系,有助于用户快速获取广告文本关键信息,进行广告文本的审核。因此文本数据中关键词和热点词的关系的快速获取具有重要的意义。现有方案中,针对文本数据中的关键词和热点词的展示,通常是将文本数据中的关键词和热点词标写在文本数据的下方,用户需要根据标写的关键词和热点词,在文本数据中找到相应的位置,进而得到关键词和热点词的关系,过程较繁琐,且效率较低。
技术实现思路
本公开实施例提供一种文本处理方法及装置,以解决无法迅速获取关键词和热点词在文本中的相互关系的问题。第一方面,本公开实施例提供一种文本处理方法,包括:获取第一句子的关键词和热点词,所述热点词为预设时段内使用频率大于第一阈值的词汇;根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,所述关键词中的所述交集字符在所述第一句子中的索引、与所述热点词中的所述交集字符在所述第一句子中的索引相同;根据所述交集字符显示所述第一句子,所述交集字符的显示方式与所述第一句子中除所述交集字符外的其他字符的显示方式不同。在一种可能的实施方式中,所述第一索引信息包括所述关键词中每个字符在所述第一句子中的索引;所述第二索引信息包括所述热点词中每个字符在所述第一句子中的索引。在一种可能的实施方式中,根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,包括:在所述第一索引信息和所述第二索引信息中确定目标索引,所述第一索引信息和所述第二索引信息均包括所述目标索引;将所述目标索引对应的字符确定为所述交集字符。在一种可能的实施方式中,根据所述交集字符显示所述第一句子,包括:确定所述交集字符的第一显示方式和非交集字符的第二显示方式,所述非交集字符为所述第一句子中除所述交集字符之外的其它字符;按照所述第一显示方式显示所述交集字符;按照所述第二显示方式显示所述非交集字符。在一种可能的实施方式中,根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符之后,还包括:在所述非交集字符中确定第一字符,所述第一字符为所述关键词中除所述交集字符之外的字符;在所述非交集字符中确定第二字符,所述第二字符为所述热点词中除所述交集字符之外的字符。在一种可能的实施方式中,根据所述交集字符显示所述第一句子,包括:确定所述交集字符的第一显示方式,并按照所述第一显示方式显示所述交集字符;确定所述第一字符的第二显示方式,并按照所述第二显示方式显示所述第一字符;确定所述第二字符的第三显示方式,并按照所述第三显示方式显示所述第二字符;确定第三字符的第四显示方式,并按照所述第四显示方式显示所述第三字符,所述第三字符为所述第一句子中除所述关键词和所述热点词之外的字符。在一种可能的实施方式中,在根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符之前,所述方法还包括:获取所述关键词中的每个字符的第一排列顺序以及所述热点词中的每个字符的第二排列顺序;获取所述关键词中的每个字符在所述第一句子中的第一位置以及所述热点词中的每个字符在所述第一句子中的第二位置;根据所述第一排列顺序和所述第一位置,确定所述第一索引信息;根据所述第二排列顺和所述第二位置,确定所述第二索引信息。第二方面,本公开实施例提供一种文本处理装置,包括:获取模块,用于获取第一句子的关键词和热点词,所述热点词为预设时段内使用频率大于第一阈值的词汇;处理模块,用于根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,所述关键词中的所述交集字符在所述第一句子中的索引、与所述热点词中的所述交集字符在所述第一句子中的索引相同;显示模块,用于根据所述交集字符显示所述第一句子,所述交集字符的显示方式与所述第一句子中除所述交集字符外的其他字符的显示方式不同。在一种可能的实施方式中,所述第一索引信息包括所述关键词中每个字符在所述第一句子中的索引;所述第二索引信息包括所述热点词中每个字符在所述第一句子中的索引。在一种可能的实施方式中,所述处理模块具体用于:在所述第一索引信息和所述第二索引信息中确定目标索引,所述第一索引信息和所述第二索引信息均包括所述目标索引;将所述目标索引对应的字符确定为所述交集字符。在一种可能的实施方式中,所述显示模块具体用于:确定所述交集字符的第一显示方式和非交集字符的第二显示方式,所述非交集字符为所述第一句子中除所述交集字符之外的其它字符;按照所述第一显示方式显示所述交集字符;按照所述第二显示方式显示所述非交集字符。在一种可能的实施方式中,所处处理模块还用于:在所述非交集字符中确定第一字符,所述第一字符为所述关键词中除所述交集字符之外的字符;在所述非交集字符中确定第二字符,所述第二字符为所述热点词中除所述交集字符之外的字符。在一种可能的实施方式中,所述显示模块具体用于:确定所述交集字符的第一显示方式,并按照所述第一显示方式显示所述交集字符;确定所述第一字符的第二显示方式,并按照所述第二显示方式显示所述第一字符;确定所述第二字符的第三显示方式,并按照所述第三显示方式显示所述第二字符;确定第三字符的第四显示方式,并按照所述第四显示方式显示所述第三字符,所述第三字符为所述第一句子中除所述关键词和所述热点词之外的字符。在一种可能的实施方式中,所述处理模块还用于:获取所述关键词中的每个字符的第一排列顺序以及所述热点词中的每个字符的第二排列顺序;获取所述关键词中的每个字符在所述第一句子中的第一位置以及所述热点词中的每个字符在所述第一句子中的第二位置;根据所述第一排列顺序和所述第一位置,确定所述第一索引信息;根据所述第二排列顺和所述第二位置,确定所述第二索引信息。第三方面,本公开实施例提供一种电子设备本文档来自技高网...

【技术保护点】
1.一种文本处理方法,其特征在于,包括:/n获取第一句子的关键词和热点词,所述热点词为预设时段内使用频率大于第一阈值的词汇;/n根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,所述关键词中的所述交集字符在所述第一句子中的索引、与所述热点词中的所述交集字符在所述第一句子中的索引相同;/n根据所述交集字符显示所述第一句子,所述交集字符的显示方式与所述第一句子中除所述交集字符外的其他字符的显示方式不同。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:
获取第一句子的关键词和热点词,所述热点词为预设时段内使用频率大于第一阈值的词汇;
根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,所述关键词中的所述交集字符在所述第一句子中的索引、与所述热点词中的所述交集字符在所述第一句子中的索引相同;
根据所述交集字符显示所述第一句子,所述交集字符的显示方式与所述第一句子中除所述交集字符外的其他字符的显示方式不同。


2.根据权利要求1所述的方法,其特征在于,
所述第一索引信息包括所述关键词中每个字符在所述第一句子中的索引;
所述第二索引信息包括所述热点词中每个字符在所述第一句子中的索引。


3.根据权利要求2所述的方法,其特征在于,根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符,包括:
在所述第一索引信息和所述第二索引信息中确定目标索引,所述第一索引信息和所述第二索引信息均包括所述目标索引;
将所述目标索引对应的字符确定为所述交集字符。


4.根据权利要求1-3任一项所述的方法,其特征在于,根据所述交集字符显示所述第一句子,包括:
确定所述交集字符的第一显示方式和非交集字符的第二显示方式,所述非交集字符为所述第一句子中除所述交集字符之外的其它字符;
按照所述第一显示方式显示所述交集字符;
按照所述第二显示方式显示所述非交集字符。


5.根据权利要求4所述的方法,其特征在于,根据所述关键词在所述第一句子中的第一索引信息和所述热点词在所述第一句子中的第二索引信息,确定所述关键词和所述热点词中均包括的交集字符之后,还包括:
在所述非交集字符中确定第一字符,所述第一字符为所述关键词中除所述交集字符之外的字符;
在所述非交集字符中确定第二字符,所述第二字符为所述热点词中除所述交集字符之外的字符。


6.根据权利要求5所述的方法,其特征在于,根据所述交集字符显示所述第一句子,包括:
确定所...

【专利技术属性】
技术研发人员:杨明
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1