【技术实现步骤摘要】
语音交互不足文本的识别方法、装置和电子设备
[0001]本专利技术涉及数据处理的
,尤其是涉及一种语音交互不足文本的识别方法
、
装置和电子设备
。
技术介绍
[0002]车主在行车过程中会与车机进行交互,交互时会因为机器识别不足导致问题没有及时回应,而如何获取这类车机没有及时回应的文本
(
可以称之为语音交互不足文本
)
是当前面临的难点
。
[0003]综上,如何识别语音交互不足文本成为目前亟需解决的技术问题
。
技术实现思路
[0004]有鉴于此,本专利技术的目的在于提供一种语音交互不足文本的识别方法
、
装置和电子设备,以缓解现有技术无法识别语音交互不足文本的技术问题
。
[0005]第一方面,本专利技术实施例提供了一种语音交互不足文本的识别方法,包括:
[0006]获取目标车辆当前行程内的车机交互语音文本,并对各所述车机交互语音文本进行分词去停用词处理,得到每句所述车机交互语音文本的分词;
[0007]基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度;
[0008]若目标相邻两句所述车机交互语音文本的相似度大于预设阈值,则将目标相邻两句所述车机交互语音文本作为语音交互不足文本上传至云端
。
[0009]进一步的,基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度,包括:
[001 ...
【技术保护点】
【技术特征摘要】
1.
一种语音交互不足文本的识别方法,其特征在于,包括:获取目标车辆当前行程内的车机交互语音文本,并对各所述车机交互语音文本进行分词去停用词处理,得到每句所述车机交互语音文本的分词;基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度;若目标相邻两句所述车机交互语音文本的相似度大于预设阈值,则将目标相邻两句所述车机交互语音文本作为语音交互不足文本上传至云端
。2.
根据权利要求1所述的方法,其特征在于,基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度,包括:对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量;在每句所述车机交互语音文本的分词中提取目标分词,得到各所述车机交互语音文本的目标分词,其中,所述目标分词为所述分词中词性为预设词性的分词;将各所述车机交互语音文本对应的第一分词向量中的与所述目标分词的位置对应的元素与预设的词性重要性进行乘积运算,得到各所述车机交互语音文本对应的第二分词向量;计算各所述车机交互语音文本的各分词的词频重要性,并将各所述车机交互语音文本对应的第二分词向量中的元素与对应的词频重要性进行乘积运算,得到各所述车机交互语音文本对应的第三分词向量;根据各所述车机交互语音文本的分词确定各所述车机交互语音文本的长度,并基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性;根据各所述车机交互语音文本对应的第三分词向量
、
各所述车机交互语音文本的长度
、
各所述车机交互语音文本的长度重要性和各所述车机交互语音文本对应的第一分词向量计算相邻两句所述车机交互语音文本的相似度
。3.
根据权利要求2所述的方法,其特征在于,对每句所述车机交互语音文本的分词进行向量化处理,包括:采用
word2vector
方法对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量
。4.
根据权利要求2所述的方法,其特征在于,计算各所述车机交互语音文本的各分词的词频重要性,包括:根据词频重要性计算算式计算各所述车机交互语音文本的各分词的词频重要性,其中,
W
当前分词
表示各所述车机交互语音文本的当前分词的词频重要性
。5.
根据权利要求2所述的方法,其特征在于,基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性,包括:根据长度重要性计算算式
计算各所述车机交互语音文本的长度重要性,其中,
W
当前车机交互语音文本
表示当前车机交互语音文本的长度重要性,
a
表示0‑1之间的可调参数
。6.
根据权利要求2所述的方法,其特征在于,根据各所述车机交互语音文本...
【专利技术属性】
技术研发人员:王佳茜,
申请(专利权)人:东软睿驰汽车技术沈阳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。