【技术实现步骤摘要】
一种识别关键词类别的方法、装置及电子设备
[0001]本专利技术涉及通信
,尤其涉及一种识别关键词类别的方法
、
装置及电子设备
。
技术介绍
[0002]通信助理是移动互联网时代,为通信助理业务用户开发的一款增值服务的应用程序,提供漏话查询
、
通信录备份
、
短信备份
、
日程提醒
、
私密空间
、
黑白名单等功能
。
[0003]目前,各个运营商的通信助理业务已日趋成熟,市场竞争也日趋激烈
,
因此,通信助理需要在业务上做到语义理解,同时帮助用户提取重要信息,并进行提醒
。
[0004]其中,在通信助理业务中,从通话中提取关键信息至关重要
。
如果在从通话内容中提取关键词之前,能够确定该通话内容对应的文本信息中各个元素所属的类别,则可以更加准确地提取文本信息中的关键词
。
[0005]然而,目前仅基于文本信息的语义特征来识别各个元素 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种识别关键词类别的方法,其特征在于,所述方法包括:获取待识别的文本信息;将所述文本信息输入至目标模型,输出所述文本信息中的各个元素所属的关键词类别;其中,所述目标模型包括用于提取所述文本信息的语义特征的第一处理层
、
用于提取所述文本信息中存在于业务词典中的目标关键词的第二处理层,以及基于所述语义特征和所述目标关键词,确定所述文本信息中的各个元素所属的关键词类别的第三处理层,所述第一处理层与所述第二处理层并行设置;所述业务词典包括在业务过程中已识别出的多个关键词
。2.
根据权利要求1所述的方法,其特征在于,所述第一处理层包括词表征层
、
段表征层
、
位置表征层以及多注意力网络层,所述词表征层
、
所述段表征层和所述位置表征层并行设置,且所述词表征层
、
所述段表征层和所述位置表征层的输出分别输入至所述多注意力网络层
。3.
根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取预训练文本信息;将所述预训练文本信息中存在于所述业务词典中的关键词替换为掩码,得到预训练输入文本;根据所述预训练输入文本,对所述第一处理层进行预训练
。4.
根据权利要求3所述的方法,其特征在于,所述根据所述预训练输入文本,对所述第一处理层进行预训练,包括:将所述预训练输入文本输入至所述第一处理层,输出对所述掩码的预测结果;计算与同一预训练输入文本对应的预测结果与被替换的关键词之间的交叉熵;根据所述交叉熵,调整所述第一处理层的参数
。5.
根据权利要求1或2所述的方法,其特征在于,所述将所述文本信息输入至目标模型,输出所述文本信息中的各个元素所属的关键词类别,包括:将所述文本信息输入至所述第一处理层,输出用于表征所述文本信息的语义特征的文本语义向量;将所述文本信息输入至所述第二处理层,通过所述第二处理层提取所述目标关键词,将所述目标关键词拼接为目标长度得到目标信息,并将所述目标信息转换为嵌入向量,其中,所述目标长度为所述文本信息的长度;将所述文本语义向量和所述嵌入向量分别输入至所述第三处理层,输出所述文本信息中的各个元素所属的关键词类别
技术研发人员:付薇薇,刘欣璋,陈诣文,方瑞玉,宋双永,张寅,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。