【技术实现步骤摘要】
文本处理方法、装置和设备
[0001]本申请涉及智能车辆领域,尤其涉及一种文本处理方法、装置和设备。
技术介绍
[0002]车载语音系统的问答模块主要是基于检索和文本匹配算法来进行答案召回,其文本匹配的准确性会直接影响车辆控制指令执行的效果,因此需要不断去优化迭代文本匹配的准确率。
[0003]现有技术中,通过提取语音文本的上下文的语义特征信息来判断两个文本之间的关联性。
[0004]然而现有技术中,语义特征信息不能准确、全面的反应文本的真实特征,导致文本匹配的准确率低。
技术实现思路
[0005]本申请提供一种文本处理方法、装置和设备,用以解决文本匹配的准确率低的问题。
[0006]第一方面本申请提供一种文本处理方法,所述方法包括:
[0007]获取待处理文本,并确定待处理文本的文本特征信息,所述文本特征信息包括所述待处理文本的语义特征信息和所述待处理文本的关键字段特征信息;
[0008]根据所述文本特征信息,确定与所述待处理文本相匹配的目标文本;
[0009 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:获取待处理文本,并确定待处理文本的文本特征信息,所述文本特征信息包括所述待处理文本的语义特征信息和所述待处理文本的关键字段特征信息;根据所述文本特征信息,确定与所述待处理文本相匹配的目标文本;根据所述目标文本,输出反馈信息。2.根据权利要求1所述的方法,其特征在于,确定待处理文本的文本特征信息,包括:提取所述待处理文本中每一字段的语义特征信息;根据第一权重矩阵和语义特征信息,确定所述待处理文本中各个字段的全局位置信息,其中,所述第一权重矩阵用于表征所述待处理文本中各个字段之间的位置关系;根据第二权重矩阵和所述待处理文本中各个字段的全局位置信息,确定所述待处理文本的关键字段特征信息,其中,所述第二权重矩阵用于表征所述待处理文本中各个字段之间的连接关系;确定所述语义特征信息和所述待处理文本的关键字段特征信息为所述待处理文本的文本特征。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取历史语音问答数据集,并根据所述历史语音问答数据集生成正样本数据集和负样本数据集;根据所述正样本数据集和所述负样本数据集,对预设模型进行预训练,确定所述第一权重矩阵和所述第二权重矩阵。4.根据权利要求3所述的方法,其特征在于,根据所述正样本数据集和所述负样本数据集,对预设模型进行预训练,确定第一权重矩阵和所述第二权重矩阵,包括:根据所述正样本数据集和所述负样本数据集,对所述预设模型进行预训练,并确定损失函数值;根据所述损失函数值对所述第一权重矩阵和所述第二权重矩阵进行权重更...
【专利技术属性】
技术研发人员:李渊,
申请(专利权)人:浙江吉利控股集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。