语音交互不足文本的识别方法技术

技术编号:39805568 阅读:12 留言:0更新日期:2023-12-22 02:39
本发明专利技术提供了一种语音交互不足文本的识别方法

【技术实现步骤摘要】
语音交互不足文本的识别方法、装置和电子设备


[0001]本专利技术涉及数据处理的
,尤其是涉及一种语音交互不足文本的识别方法

装置和电子设备


技术介绍

[0002]车主在行车过程中会与车机进行交互,交互时会因为机器识别不足导致问题没有及时回应,而如何获取这类车机没有及时回应的文本
(
可以称之为语音交互不足文本
)
是当前面临的难点

[0003]综上,如何识别语音交互不足文本成为目前亟需解决的技术问题


技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种语音交互不足文本的识别方法

装置和电子设备,以缓解现有技术无法识别语音交互不足文本的技术问题

[0005]第一方面,本专利技术实施例提供了一种语音交互不足文本的识别方法,包括:
[0006]获取目标车辆当前行程内的车机交互语音文本,并对各所述车机交互语音文本进行分词去停用词处理,得到每句所述车机交互语音文本的分词;
[0007]基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度;
[0008]若目标相邻两句所述车机交互语音文本的相似度大于预设阈值,则将目标相邻两句所述车机交互语音文本作为语音交互不足文本上传至云端

[0009]进一步的,基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度,包括:
[0010]对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量;
[0011]在每句所述车机交互语音文本的分词中提取目标分词,得到各所述车机交互语音文本的目标分词,其中,所述目标分词为所述分词中词性为预设词性的分词;
[0012]将各所述车机交互语音文本对应的第一分词向量中的与所述目标分词的位置对应的元素与预设的词性重要性进行乘积运算,得到各所述车机交互语音文本对应的第二分词向量;
[0013]计算各所述车机交互语音文本的各分词的词频重要性,并将各所述车机交互语音文本对应的第二分词向量中的元素与对应的词频重要性进行乘积运算,得到各所述车机交互语音文本对应的第三分词向量;
[0014]根据各所述车机交互语音文本的分词确定各所述车机交互语音文本的长度,并基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性;
[0015]根据各所述车机交互语音文本对应的第三分词向量

各所述车机交互语音文本的长度

各所述车机交互语音文本的长度重要性和各所述车机交互语音文本对应的第一分词
向量计算相邻两句所述车机交互语音文本的相似度

[0016]进一步的,对每句所述车机交互语音文本的分词进行向量化处理,包括:
[0017]采用
word2vector
方法对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量

[0018]进一步的,计算各所述车机交互语音文本的各分词的词频重要性,包括:
[0019]根据词频重要性计算算式计算各所述车机交互语音文本的各分词的词频重要性,其中,
w
当前分词
表示各所述车机交互语音文本的当前分词的词频重要性

[0020]进一步的,基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性,包括:
[0021]根据长度重要性计算算式计算各所述车机交互语音文本的长度重要性,其中,
w
当前车机交互语音文本
表示当前车机交互语音文本的长度重要性,
a
表示0‑1之间的可调参数

[0022]进一步的,根据各所述车机交互语音文本对应的第三分词向量

各所述车机交互语音文本的长度

各所述车机交互语音文本的长度重要性和各所述车机交互语音文本对应的第一分词向量计算相邻两句所述车机交互语音文本的相似度,包括:
[0023]根据车机交互语音文本相似度计算算式计算相邻两句所述车机交互语音文本的相似度,其中,
sim(S1

S2)
表示相邻两句所述车机交互语音文本
S1

S2
的相似度,
A
S1
表示车机交互语音文本
S1
对应的第三分词向量,
B
S2
表示车机交互语音文本
S2
对应的第三分词向量,
w
S1
表示车机交互语音文本
S1
的长度重要性,
w
s2
表示车机交互语音文本
S2
的长度重要性,
len(S1)
表示车机交互语音文本
S1
的长度,
len(S2)
表示车机交互语音文本
S2
的长度,
||a
S1
||
表示车机交互语音文本
S1
对应的第一分词向量的模,
||b
S2
||
表示车机交互语音文本
S2
对应的第一分词向量的模

[0024]进一步的,所述方法还包括:
[0025]根据所述云端存储的所述语音交互不足文本进行语音系统的优化

[0026]第二方面,本专利技术实施例还提供了一种语音交互不足文本的识别装置,包括:
[0027]分词去停用词处理单元,用于获取目标车辆当前行程内的车机交互语音文本,并对各所述车机交互语音文本进行分词去停用词处理,得到每句所述车机交互语音文本的分词;
[0028]计算单元,用于基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度;
[0029]上传单元,用于若目标相邻两句所述车机交互语音文本的相似度大于预设阈值,则将目标相邻两句所述车机交互语音文本作为语音交互不足文本上传至云端

[0030]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器

处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤

[0031]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述第一方面任一项所述的方法

[0032]在本专利技术实施例中,提供了一种语音交互不足文本的识别方法,包括:获取目标车辆当前行程内的车机交互语音文本,并对各车机交互语音文本进行分词去停用词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语音交互不足文本的识别方法,其特征在于,包括:获取目标车辆当前行程内的车机交互语音文本,并对各所述车机交互语音文本进行分词去停用词处理,得到每句所述车机交互语音文本的分词;基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度;若目标相邻两句所述车机交互语音文本的相似度大于预设阈值,则将目标相邻两句所述车机交互语音文本作为语音交互不足文本上传至云端
。2.
根据权利要求1所述的方法,其特征在于,基于每句所述车机交互语音文本的分词计算相邻两句所述车机交互语音文本的相似度,包括:对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量;在每句所述车机交互语音文本的分词中提取目标分词,得到各所述车机交互语音文本的目标分词,其中,所述目标分词为所述分词中词性为预设词性的分词;将各所述车机交互语音文本对应的第一分词向量中的与所述目标分词的位置对应的元素与预设的词性重要性进行乘积运算,得到各所述车机交互语音文本对应的第二分词向量;计算各所述车机交互语音文本的各分词的词频重要性,并将各所述车机交互语音文本对应的第二分词向量中的元素与对应的词频重要性进行乘积运算,得到各所述车机交互语音文本对应的第三分词向量;根据各所述车机交互语音文本的分词确定各所述车机交互语音文本的长度,并基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性;根据各所述车机交互语音文本对应的第三分词向量

各所述车机交互语音文本的长度

各所述车机交互语音文本的长度重要性和各所述车机交互语音文本对应的第一分词向量计算相邻两句所述车机交互语音文本的相似度
。3.
根据权利要求2所述的方法,其特征在于,对每句所述车机交互语音文本的分词进行向量化处理,包括:采用
word2vector
方法对每句所述车机交互语音文本的分词进行向量化处理,得到各所述车机交互语音文本对应的第一分词向量
。4.
根据权利要求2所述的方法,其特征在于,计算各所述车机交互语音文本的各分词的词频重要性,包括:根据词频重要性计算算式计算各所述车机交互语音文本的各分词的词频重要性,其中,
W
当前分词
表示各所述车机交互语音文本的当前分词的词频重要性
。5.
根据权利要求2所述的方法,其特征在于,基于各所述车机交互语音文本的长度计算各所述车机交互语音文本的长度重要性,包括:根据长度重要性计算算式
计算各所述车机交互语音文本的长度重要性,其中,
W
当前车机交互语音文本
表示当前车机交互语音文本的长度重要性,
a
表示0‑1之间的可调参数
。6.
根据权利要求2所述的方法,其特征在于,根据各所述车机交互语音文本...

【专利技术属性】
技术研发人员:王佳茜
申请(专利权)人:东软睿驰汽车技术沈阳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1