【技术实现步骤摘要】
文本内容标识方法、装置、设备及计算机可读存储介质
本公开实施例涉及计算机
,尤其涉及文本内容标识方法、装置、设备及计算机可读存储介质。
技术介绍
在日常生活中,人们通常会面临着阅读大量文本的情况,例如,阅读注意事项、产品手册、阅读法律协议等等。在一个文本中,有些内容对于用户是重要的,有一些内容则不那么重要。但是,由于内容太多或阅读上的不便,会导致阅读者无法直观分辨重要内容,遗漏一些关键信息,这可能带来对用户不利的后果。例如,随着互联网的发展,人们在使用互联网相关的服务时,通常需要签署服务协议,但是一般情况下服务协议非常长且专业术语多。因为阅读时的不方便,导致用户签署协议前不阅读或者粗略浏览,因此用户可能会遗漏关键条款,从而泄露个人信息或造成其他损失。
技术实现思路
有鉴于此,本公开第一方面提供了一种文本内容标识方法,包括:根据文本类别确定预设的包括多个关键特征的关键特征序列以及预设的关键特征权重规则,其中,所述关键特征权重规则记录有为文本内容中的关键特征分配权重的规则;根据与文本类别对应的文本内容划分规则将文本内容划分为多个内容部分,并且对所述多个内容部分中出现 ...
【技术保护点】
1.一种文本内容标识方法,其特征在于,包括:根据文本类别确定预设的包括多个关键特征的关键特征序列以及预设的关键特征权重规则,其中,所述关键特征权重规则记录有为文本内容中的关键特征分配权重的规则;根据与文本类别对应的文本内容划分规则将文本内容划分为多个内容部分,并且对所述多个内容部分中出现的关键特征做标记;根据所述预设的关键特征权重规则,计算每一内容部分中的关键特征的权重之和;输出划分为所述多个内容部分的文本内容,其中,根据所述关键特征的权重之和对所述多个内容部分做出标识。
【技术特征摘要】
1.一种文本内容标识方法,其特征在于,包括:根据文本类别确定预设的包括多个关键特征的关键特征序列以及预设的关键特征权重规则,其中,所述关键特征权重规则记录有为文本内容中的关键特征分配权重的规则;根据与文本类别对应的文本内容划分规则将文本内容划分为多个内容部分,并且对所述多个内容部分中出现的关键特征做标记;根据所述预设的关键特征权重规则,计算每一内容部分中的关键特征的权重之和;输出划分为所述多个内容部分的文本内容,其中,根据所述关键特征的权重之和对所述多个内容部分做出标识。2.根据权利要求1所述的方法,其特征在于,所述根据所述预设的关键特征权重规则,计算每一内容部分中的关键特征的权重之和,包括:根据计算出的每一内容部分中的关键特征的权重之和对所述多个内容部分进行排序。3.根据权利要求2所述的方法,其特征在于,所述输出划分为所述多个内容部分的文本内容,其中,根据所述关键特征的权重之和对所述多个内容部分做出标识,包括:根据所述多个内容部分进行的排序结果,输出划分为所述多个内容部分的文本内容。4.根据权利要求3所述的方法,其特征在于,所述输出划分为所述多个内容部分的文本内容,其中,根据所述关键特征的权重之和对所述多个内容部分做出标识,包括:根据所述多个内容部分进行的排序结果,按照关键特征的权重之和大的内容部分在前的顺序输出划分为所述多个内容部分的文本内容。5.根据权利要求1-4任一项所述的方法,其特征在于,所述输出划分为所述多个内容部分的文本内容,其中,根据所述关键特征的权重之和对所述多个内容部分做出标识,包括:输出所述文本内容中关键特征的权重之和大于预设阈值的内容部分。6.根据权利要求1所述的方法,其特征在于,所述关键特征权重规则记录有所述关键特征序列中的每一关键特征的权重、连续出现的多个关键特征的权重、与所属类别对应的关键特征的权重、跨类别的关键特征的权重中的至少之一。7.根据权利要求6所述的方法,其特征在于,所述类别包括隐私类、资金类、安全类、人身权利类、时间期限类、纠纷处理类和惩罚赔偿类中的至少之一。8.根据权利要求1所述的方法,其特征在于,根据所述关键特征的权重之和对所述多个内容部分做出的标识包括内容部分上附加有特定标志、内容部分的字体大小、内容部分的字体颜色、内容部分的动画效果中的至少之一。9.一种文本内容标识装置,其特征在于,包括:...
【专利技术属性】
技术研发人员:马欣欣,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。