语音邮件垃圾信息检测制造技术

技术编号:34363933 阅读:15 留言:0更新日期:2022-07-31 08:03
本公开的实施例涉及语音邮件垃圾信息检测。语音邮件垃圾信息检测是基于语音邮件消息的内容执行的。将传入语音邮件消息的内容与包括垃圾语音邮件的表示的垃圾邮件模板相比较。垃圾信息模板可基于用户针对其接收到的语音邮件消息提供的垃圾信息指示来生成。通过维护垃圾信息模板的投票计数来聚合足够相似的语音邮件消息的用户指示,投票计数反映用户已经指示匹配语音邮件消息是垃圾信息的次数。垃圾信息模板还可以包括出现计数,其反映匹配垃圾信息模板的语音邮件消息在电话系统中已被检测到的次数。可将传入的语音邮件消息与垃圾信息模板相比较,并且响应于内容的匹配和/或相应投票计数或出现计数满足条件,语音邮件消息可被标识为垃圾信息。可被标识为垃圾信息。可被标识为垃圾信息。

Voice mail spam detection

【技术实现步骤摘要】
语音邮件垃圾信息检测

技术介绍

[0001]企业实体依靠多种通信模式来支持其操作,包括电话、电子邮件、内部消息传递等。这些分开的通信模式历来是由服务提供商实现的,这些服务提供商的服务未相互集成。至少在某些情况下,这些服务之间的断开要求用户手动将信息从一项服务传递到下一项服务。此外,传统上,某些服务(诸如,电话服务)是通过本地部署解决方案交付的,这意味着远程工作人员和通常越来越机动的人员可能无法依靠它们。一种解决方案是借助统一通信即服务(UCaaS)平台,该平台包括通过网络(诸如,互联网)集成的若干通信服务,以交付完整的通信体验,而与物理位置无关。

技术实现思路

[0002]本文尤其公开了用于语音邮件垃圾信息检测的系统和技术的实施方式。
[0003]本公开的一方面是一种方法,该方法包括:接收第一语音邮件消息;将第一语音邮件消息与垃圾信息模板的语音邮件表示相比较,其中垃圾信息模板包括语音邮件表示和投票计数,该投票计数反映一个或多个用户已经指示与语音邮件表示匹配的语音邮件消息是垃圾信息的次数;将垃圾信息模板的投票计数与第一阈值相比较;响应于第一语音邮件消息与垃圾信息模板的语音邮件表示之间的匹配并且投票计数超过第一阈值,将第一语音邮件消息标识为垃圾信息;以及响应于将第一语音邮件消息标识为垃圾信息,对第一语音邮件消息调用垃圾信息抑制措施。
[0004]本公开的一方面是一种系统,该系统包括处理器和存储器,其中存储器存储指令,该指令可由处理器执行以:接收第一语音邮件消息;将第一语音邮件消息与垃圾信息模板的语音邮件表示相比较,其中垃圾信息模板包括语音邮件表示和投票计数,该投票计数反映一个或多个用户已经指示与语音邮件表示匹配的语音邮件消息是垃圾信息的次数;将垃圾信息模板的投票计数与第一阈值相比较;以及响应于第一语音邮件消息与垃圾信息模板的语音邮件表示之间的匹配并且投票计数超过第一阈值,将第一语音邮件消息标识为垃圾信息。
[0005]本公开的一方面是一种方法,该方法包括:接收第一语音邮件消息;对第一语音邮件消息应用语音识别模块,以获得基于第一语音邮件消息的文本转录本;将文本转录本输入到语言模型中,以获得表示第一语音邮件消息的一个或多个词向量;将表示第一语音邮件消息的一个或多个词向量与垃圾信息模板的一个或多个词向量相比较,其中垃圾信息模板包括表示语音邮件的一个或多个词向量;基于词向量的比较,将第一语音邮件消息标识为垃圾信息;以及响应于将第一语音邮件消息标识为垃圾信息,对第一语音邮件消息调用垃圾信息抑制措施。
附图说明
[0006]当结合附图阅读时,根据以下详细描述可以最好地理解本公开。需要强调的是,根据惯例,附图的各个特征未按比例绘制。相反,为了清楚起见,各个特征的尺寸被任意放大
或缩小。
[0007]图1是电子计算和通信系统的示例的框图。
[0008]图2是电子计算和通信系统的计算设备的示例内部配置的框图。
[0009]图3是由电子计算和通信系统实现的软件平台的示例的框图。
[0010]图4是被配置为检测垃圾语音邮件消息的电话系统的示例的框图。
[0011]图5是用于基于垃圾语音邮件的用户指示来更新垃圾信息模板列表的技术的示例的流程图。
[0012]图6是用于使用垃圾信息模板来检测垃圾语音邮件消息的技术的示例的流程图。
[0013]图7是用于将语音邮件消息与垃圾信息模板的语音邮件表示相比较的技术的示例的流程图。
[0014]图8是用于使用垃圾信息模板来检测垃圾语音邮件消息的技术的示例的流程图。
具体实施方式
[0015]近年来,垃圾电话呼叫激增。在2017年,美国所有的电话中有2.7%为垃圾呼叫。在2019年,垃圾呼叫增加到美国所有电话的40%。由于垃圾呼叫越来越多,接听来自未知呼叫者的电话的人越来越少,因此这些呼叫直接进入语音信箱。此外,大多数呼叫阻止服务和应用都会绕过电话振铃并将呼叫转移到语音信箱。因此,检测垃圾语音信箱对于电话服务提供商已经变得很重要。
[0016]大多数现有的用于垃圾呼叫检测的系统通过检测已经与垃圾信息相关联的电话号码来起作用(例如,到个人或组织的被阻止呼叫者列表)。垃圾呼叫者通常可以通过经常更改其用来发出垃圾呼叫的电话号码来规避这些垃圾信息阻止者。许多现有系统将被标识为垃圾信息的呼叫直接转移到语音信箱,这可以用垃圾消息填满用户的语音邮件收件箱。通过电话网络自动分发垃圾消息的语录电话呼叫者(robocaller)软件的出现加剧了这些问题。
[0017]本公开的实施方式通过基于垃圾语音邮件消息的内容检测垃圾语音邮件消息来解决诸如此类的问题。假定大多数垃圾语音邮件是广播记录的消息,则重复和广播计数可以成为确定语音邮件是否是垃圾信息的重要特征。本文描述了一种系统,其中:第一用户将语音邮件标记为垃圾信息。后端服务器从所有用户收集总垃圾信息投票,并建立垃圾信息模板列表,其中相应的垃圾信息模板包括垃圾语音邮件消息的内容的表示,该垃圾语音邮件消息的内容的表示可以与将来的传入语音邮件消息相比较。垃圾信息模板还可以包括投票计数,该投票计数反映有多少用户已经将与该垃圾信息模板匹配的语音邮件标示为垃圾信息。在一些实施方式中,垃圾信息模板还可以包括出现计数,该出现计数反映有多少与垃圾信息模板匹配的语音邮件消息已经被电话系统检测到。对于传入的新语音邮件,电话服务器可以将传入的语音邮件消息的内容与垃圾信息模板相比较。例如,如果新的语音邮件与任何垃圾信息模板高度相似,并且用户对该垃圾信息模板的集体投票计数超过最大阈值,则该新的语音邮件可以被标识为垃圾信息。
[0018]可以采用各种技术来将语音邮件消息的内容与垃圾信息模板相比较。例如,可以将语音识别模块应用于语音邮件消息的音频信号以获得语音邮件消息的文本转录表示,并且可以将该文本转录表示与存储在垃圾信息模板中的语音邮件的可比较表示相比较。在一
些实施方式中,可以使用自然语言模型将语音邮件消息的文本转录本进一步转换为一个或多个词向量,以促进比较。例如,表示传入语音邮件消息的一个或多个词向量(例如,词嵌入向量)可以与存储在垃圾信息模板中的一个或多个词向量相比较(例如,使用余弦相似度)。在一些实施方式中,传入语音邮件消息的音频信号可以与存储在垃圾信息模板中的音频信号相比较(例如,使用诸如均方差之类的距离度量或者使用对应的音频指纹之间的位差)。
[0019]当语音邮件消息被标识为垃圾信息时,可以将一种或多种垃圾信息抑制措施应用于该语音邮件消息。例如,垃圾信息抑制措施可以包括将语音邮件消息标记为潜在的垃圾信息。例如,垃圾信息抑制措施可以包括阻止语音邮件消息进入用户的语音邮件收件箱。例如,垃圾信息抑制措施可以包括删除该语音邮件消息。例如,垃圾信息抑制措施可以包括在用户界面中显示指示该语音邮件消息是垃圾信息的消息。
[0020]使用垃圾信息的用户指示与针对垃圾信息模板的投票计数的聚合的实施方式可以利用三个工具:垃圾信息模板收集器、垃圾信息过滤器以及垃圾信息调节器。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:接收第一语音邮件消息;将所述第一语音邮件消息与垃圾信息模板的语音邮件表示相比较,其中所述垃圾信息模板包括投票计数,所述投票计数反映一个或多个用户已经指示与所述语音邮件表示匹配的语音邮件消息是垃圾信息的次数;将所述垃圾信息模板的所述投票计数与第一阈值相比较;响应于所述第一语音邮件消息与所述垃圾信息模板的所述语音邮件表示之间的匹配并且所述投票计数超过所述第一阈值,将所述第一语音邮件消息标识为垃圾信息;以及响应于将所述第一语音邮件消息标识为垃圾信息,对所述第一语音邮件消息调用垃圾信息抑制措施。2.根据权利要求1所述的方法,其中所述垃圾信息模板的所述语音邮件表示包括一个或多个词向量,并且将所述第一语音邮件消息与所述垃圾信息模板的所述语音邮件表示相比较包括:将语音识别模块应用于所述第一语音邮件消息以获得表示所述第一语音邮件消息的文本转录本;将所述文本转录本输入到语言模型,以获得表示所述第一语音邮件消息的一个或多个词向量;以及将表示所述第一语音邮件消息的所述一个或多个词向量与所述垃圾信息模板的所述一个或多个词向量相比较。3.根据权利要求2所述的方法,其中将表示所述第一语音邮件消息的所述一个或多个词向量与所述垃圾信息模板的所述一个或多个词向量相比较包括:确定词向量之间的余弦相似度。4.根据权利要求1所述的方法,其中所述垃圾信息模板的所述语音邮件表示包括音频记录,并且将所述第一语音邮件消息与所述垃圾信息模板的所述语音邮件表示相比较包括:确定所述垃圾信息模板的所述音频记录与所述第一语音邮件消息的音频记录之间的距离度量。5.根据权利要求1所述的方法,其中所述垃圾信息模板还包括出现计数,所述出现计数反映已经被匹配到所述垃圾信息模板的所述语音邮件表示的已接收的语音邮件消息的数目,并且还包括:将所述垃圾信息模板的所述出现计数与第二阈值相比较,其中响应于所述出现计数超过所述第二阈值,将所述第一语音邮件消息标识为垃圾信息。6.根据权利要求1所述的方法,还包括:接收第二语音邮件消息;从用户接收所述第二语音邮件消息是垃圾信息的指示;将所述第二语音邮件消息与所述垃圾信息模板的所述语音邮件表示相比较;以及响应于所述第二语音邮件消息与所述垃圾信息模板的所述语音邮件表示之间的匹配,增加所述垃圾信息模板的所述投票计数。7.根据权利要求1所述的方法,其中所述垃圾信息抑制措施包括:阻止所述第一语音邮
件消息进入用户的语音邮件收件箱。8.根据权利要求1所述的方法,其中所述垃圾信息抑制措施包括:删除所述第一语音邮件消息。9.根据权利要求1所述的方法,其中所述垃圾信息抑制措施包括:在用户界面中显示指示所述第一语音邮件消息是垃圾信息的消息。10.一种系统,包括:处理器,以及存储器,其中所述存储器存储指令,所述指令由所述处理器可执行以:接收第一条语音邮件消息;将所述第一语音邮件消息与垃圾信息模板的语音邮件表示相比较,其中所述垃圾信息模板包括投票计数,所述投票计数反映一个或多个用户已经指示与所述语音邮件表示匹配的语音邮件消息为垃圾信息的次数;将所述垃圾信息模板的所述投票计数与第一阈值相比较;以及响应于所述第一语音邮件消息与所述垃圾信息模板的所述语音邮件表示之间的匹配并且所述投票计数超过所述第一阈值...

【专利技术属性】
技术研发人员:肖敏耿海峰钱梦晓文卉孙丰财
申请(专利权)人:ZOOM视频通讯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1