【技术实现步骤摘要】
文本重点内容标记方法、装置、计算机设备及存储介质
本专利技术涉及计算机软件
,尤其涉及一种文本重点内容标记方法、装置、计算机设备及存储介质。
技术介绍
在日常生活中,常常需要将文本中的重点内容标注出来。以合同文本为例,合同中通常会涉及较多的合同条款,为了保证合同所涉及的所有对象的利益,合同所涉及的对象需要详细审核合同中的各条条款。然而,用于描述合同条款的词和字通常冗长且晦涩,所以审核人员容易忽略掉本该特别注意的重点内容,因而需要在制定合同时将重点内容着重标记出来,便于重点关注。例如,对于保险合同,监管部门要求保险合同中的所有免责条款必须做出明确标记,以保障投保人的权益。对保险合同中的这些条款,通常需采用加粗、斜体字、黑体字等方式做出标记提示。然而,目前在合同文本或其它文本的撰写过程中,需要手动将重点内容一一标记出来,不仅费时费力,而且容易出错,严重影响工作效率和质量。
技术实现思路
针对上述现有技术的不足,本专利技术的目的在于提供一种文本重点内容标记方法、装置、计算机设备及存储介质,以实现对 ...
【技术保护点】
1.一种文本重点内容标记方法,其特征在于,包括以下步骤:/n获取训练语料,所述训练语料中的关键文本串经过重点标记;/n对所述训练语料中经过重点标记的关键文本串和未经过重点标记的非关键文本串进行不同标签标注,得到所述训练语料对应的实际标签标注结果;/n根据所述训练语料及对应的所述实际标签标注结果,对预先建立的机器学习模型进行训练,得到经过训练的机器学习模型;/n利用所述经过训练的机器学习模型对待标记文本进行处理,预测得到所述待标记文本的标签标注结果;/n根据所述待标记文本的标签标注结果,将所述待标记文本中的重点内容标记出来。/n
【技术特征摘要】
1.一种文本重点内容标记方法,其特征在于,包括以下步骤:
获取训练语料,所述训练语料中的关键文本串经过重点标记;
对所述训练语料中经过重点标记的关键文本串和未经过重点标记的非关键文本串进行不同标签标注,得到所述训练语料对应的实际标签标注结果;
根据所述训练语料及对应的所述实际标签标注结果,对预先建立的机器学习模型进行训练,得到经过训练的机器学习模型;
利用所述经过训练的机器学习模型对待标记文本进行处理,预测得到所述待标记文本的标签标注结果;
根据所述待标记文本的标签标注结果,将所述待标记文本中的重点内容标记出来。
2.根据权利要求1所述的文本重点内容标记方法,其特征在于,所述机器学习模型包含双向长短期记忆模型和条件随机场模型。
3.根据权利要求2所述的文本重点内容标记方法,其特征在于,所述对预先建立的机器学习模型进行训练的步骤包括:获取所述训练语料对应的词向量;将所述训练语料对应的词向量及所述训练语料对应的实际标签标注结果输入到预先建立的双向长短期记忆模型和条件随机场模型进行迭代训练,得到经过训练的双向长短期记忆模型和条件随机场模型。
4.根据权利要求3所述的文本重点内容标记方法,其特征在于,所述利用所述经过训练的机器学习模型对所述待标记文本进行处理,得到所述待标记文本的标签标注结果的步骤包括:
获取所述待标记文本中各词对应的词向量;
利用经过训练的双向长短期记忆模型对所述待标记文本中各词对应的词向量进行处理,得到所述待标记文本对应的文本特征序列;
利用经过训练的条件随机场模型对所述待标记文本对应的文本特征序列进行处理,预测得到所述待标记文本的标签标注结果。
5.根据权利要求1所述的文本重点内容标记方法,其特征在于,所述在所述对所述训练语料中经过标记的关键文本串和未经过标记的非关键文本串进行不同标签标注的步骤包括:对各所述...
【专利技术属性】
技术研发人员:张思亮,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。