用于呼叫分类的系统和方法技术方案

技术编号:29843303 阅读:21 留言:0更新日期:2021-08-27 14:34
本发明专利技术涉及用于呼叫分类的系统和方法,所述方法包括:拦截发起设备和接收设备之间的语音呼叫的会话;将在语音呼叫的会话期间在发起设备和接收设备之间交换的语音呼叫数据转换为预定义的数据格式;分析转换后的语音呼叫数据以确定所拦截的语音呼叫的一个或多个属性;基于所确定的一个或多个属性来识别与所拦截的语音呼叫的会话相关联的一个或多个特征。使用所识别的一个或多个特征对所拦截的语音呼叫进行分类。

【技术实现步骤摘要】
用于呼叫分类的系统和方法
本专利技术涉及信息安全领域,更具体地,涉及用于语音呼叫分类的系统和方法。
技术介绍
当前,通用移动设备(例如移动电话、智能手机、平板电脑等)的几乎每个所有者都在处理来自银行、医疗中心、保险公司、美容院和其他在其工作中使用电话营销的公司的不想要的呼叫。在美国,事实上,法律禁止某些未经用户同意的电话营销员的呼叫。但是,大多数公司在合同中暗含地规定了这样的条款,并且绕开了法律。在某些情况下,提供电话营销服务的公司积极使用在交流过程中可以模仿人的智能机器人(机器人)。机器人确定人的烦躁或兴趣的程度,并经常以避免营销语气的方式来定制对话。黑客也经常使用智能机器人来获取用户的机密信息(例如与信用卡、社会保险号等相关的数据)。当前,存在用于处理这种令人讨厌的呼叫的确定电话号码的移动应用程序(例如TrueCaller(真实呼叫者))。在大多数情况下,将根据不断更新的垃圾号码的数据库检查进入的呼叫,如果在该数据库中存在呼叫垃圾制造者或黑客的号码,则通知用户已经在入侵通信中检测到呼叫方。然而,目前,可以在号码交换技术的帮助下匿名进行电话呼叫或掩藏电话号码。黑客和其他恶意实体越来越多地使用此技术根据信贷机构的号码来呼叫银行客户,并请求进行提款所需的信息。常规系统设备齐全以便很好地处理识别机器人化的呼叫的问题,但是通常无法将来自各种恶意实体的呼叫进行分类。而且,在新的黑客计划中,号码的改变使合法订户而不是黑客失去信用。阻止此类号码例如可能导致银行失去联系其客户的能力。因此,需要解决呼叫分类的问题(包括利用交换号码的黑客呼叫)。
技术实现思路
公开了用于通过分析语音呼叫的记录和某些属性来对语音呼叫进行分类、并且通过呼叫分类向用户提供关于特定呼叫类别的信息的系统和方法。在一方面,提出了一种用于语音呼叫的分析和分类的方法,其中,该方法包括以下步骤:拦截发起设备和接收设备之间的语音呼叫的会话;将在语音呼叫的会话期间在发起设备和接收设备之间交换的语音呼叫数据转换为预定义的数据格式;分析转换后的语音呼叫数据以确定所拦截的语音呼叫的一个或多个属性;基于所确定的一个或多个属性来识别与所拦截的语音呼叫的会话相关联的一个或多个特征;使用所识别的一个或多个特征对所拦截的语音呼叫进行分类。在一方面,转换语音呼叫数据还包括记录语音呼叫数据。在一方面,预定义的数据格式包括格式化文本。在一方面,所拦截的语音呼叫的分类类型包括以下中的至少一者:常规呼叫和不想要的呼叫。在一方面,所识别的一个或多个特征包括以下中的至少一者:呼叫类别、语音呼叫数据的情绪成分、机器人化的语音的存在、和呼叫持续时间。在一方面,呼叫类别包括以下中的至少一者:电话营销、社会调查、提供服务、欺诈。在一方面,基于记录,使用一个或多个呼叫分类属性来确定呼叫类别。在一方面,呼叫分类属性包括以下中的至少一者:词、n元语法(n-grams)、词嵌入、词袋。在一方面,所拦截的语音呼叫的情绪成分基于以下中的至少一者而是积极或消极的:(i)将文本分解成词或词序列的规则,所述词或词序列具有预先指定的积极或消极的评价;(ii)词汇表,其中对来自预先编译的词汇表的积极词和消极词的数量进行计数;(iii)机器学习。在一方面,使用一组预先选择的音素串来确定机器人化的语音的存在。在一方面,对所拦截的语音呼叫进行分类还包括使用基于一组具有特征的预先选择的语音呼叫的经训练的分类模型。在一方面,经训练的分类模型基于以下中的至少一者:朴素贝叶斯分类器、逻辑回归、MRF(马尔可夫随机场)分类器、SVM(支持向量机)、k最近邻、和/或决策树。在一方面,该方法还包括向接收设备发送通知。在一方面,该通知指示所拦截的语音呼叫的分类类别。附图说明并入本说明书中并构成本说明书的一部分的附图示出了本专利技术的一个或多个示例方面,并且与详细描述一起用于解释本专利技术的一个或多个示例方面的原理和实现方式。图1示出了根据本专利技术的各方面的通信网络的框图。图2示出了根据本专利技术的各方面的智能通信网络的框图。图3示出了根据本专利技术的各方面的呼叫分类系统。图4示出了根据本专利技术的各方面的用于分析和分类语音呼叫的方法。图5示出了通用计算机系统的示例。具体实施方式本文在用于语音呼叫分类的系统、方法和计算机程序产品的上下文中描述了示例性方面。本领域普通技术人员将认识到,以下描述仅是说明性的,而不旨在以任何方式进行限制。其他方面将很容易将其自身暗示给了解本专利技术的优点的本领域的技术人员。现在将详细参考如附图中所示的示例性方面的实现。在整个附图和以下描述中将尽可能使用相同的附图标记来指代相同或类似的项目。图1示出了通信网络的框图。通信网络100可包括发起设备101、接收设备102、交换节点110和媒体数据111。通信网络100提供多个物理通信信道和至少一个交换节点110。交换节点110提供用于在发起设备101和接收设备102之间传输媒体数据111(诸如语音呼叫数据)的服务。通信网络100的示例可包括但不限于:计算机网络;电话网络、和/或蜂窝通信网络。术语“设备”(例如发起设备和接收设备)是指将用户信息转换为媒体数据111(例如语音呼叫数据)以用于通过通信信道传输并执行反向转换的设备。术语“拨打”是指由发起设备101发起的与接收设备102建立连接的尝试。术语“呼叫”是指在建立的语音呼叫会话中在发起设备101和接收设备102之间传输媒体数据111的过程。媒体数据111可以包括:媒体文件;和/或流数据(以流模式发送的媒体数据)。例如,发起设备101和接收设备102可以是蜂窝通信网络的订户的移动电话,其中术语“呼叫”是指普通语音呼叫。图2示出了根据本专利技术的各方面的智能网络的框图。智能通信网络200的示例可以包括交换节点110、服务交换点220、服务控制点230和分支点240。智能网络200可以通过使通信网络100的至少一个交换节点110现代化而促进附加的通信服务。应当注意,智能网络200的架构与交换网络100的类型无关。在该示例中,交换节点110保留用于提供基本服务的功能,但是它也可以配备有服务交换点220。服务交换点220可以被配置为提供各种呼叫处理算法的初始化,可以执行从服务控制点230到达的指令,并且可以监控智能网络200的呼叫处理过程。服务控制点230可以促进整个智能网络200中的服务,提供用于其元件之间的交互的协议。在一变型方面,智能网络200可以包含分支点240,分支点240可以被配置为提供媒体数据111的副本到智能网络200的其他辅助元件(例如,语音识别设备)的传输,从而使智能网络200的服务对用户更加方便。由智能网络200提供的服务可以包括但不限于:免费呼叫服务、免费提供名录信息;电话投票、通过拨打特定号码来提供投票功能;和/或通过预付卡提供通信。图3示出了根据本专利技术的各方面的本文档来自技高网
...

【技术保护点】
1.一种用于分析和分类语音呼叫的方法,所述方法包括:/n拦截发起设备和接收设备之间的语音呼叫的会话;/n将在所述语音呼叫的会话期间在所述发起设备和所述接收设备之间交换的语音呼叫数据转换为预定义的数据格式;/n分析转换后的语音呼叫数据以确定所拦截的语音呼叫的一个或多个属性;/n基于所确定的一个或多个属性来识别与所拦截的语音呼叫的会话相关联的一个或多个特征;以及/n使用所识别的一个或多个特征对所拦截的语音呼叫进行分类。/n

【技术特征摘要】
20200226 RU 2020108161;20210122 US 17/155,3391.一种用于分析和分类语音呼叫的方法,所述方法包括:
拦截发起设备和接收设备之间的语音呼叫的会话;
将在所述语音呼叫的会话期间在所述发起设备和所述接收设备之间交换的语音呼叫数据转换为预定义的数据格式;
分析转换后的语音呼叫数据以确定所拦截的语音呼叫的一个或多个属性;
基于所确定的一个或多个属性来识别与所拦截的语音呼叫的会话相关联的一个或多个特征;以及
使用所识别的一个或多个特征对所拦截的语音呼叫进行分类。


2.如权利要求1所述的方法,其中,转换所述语音呼叫数据还包括记录所述语音呼叫数据,并且,所述预定义的数据格式包括格式化文本。


3.如权利要求2所述的方法,其中,所拦截的语音呼叫的分类类型包括以下中的至少一者:常规呼叫和不想要的呼叫,并且,所识别的所述一个或多个特征包括以下中的至少一者:呼叫类别、所述语音呼叫数据的情绪成分、机器人化的语音的存在、和呼叫持续时间。


4.如权利要求3所述的方法,其中,所述呼叫类别包括以下中的至少一者:电话营销、社会调查、提供服务、欺诈。


5.如权利要求4所述的方法,其中,所述呼叫类别是基于所述记录使用一个或多个呼叫分类属性来确定的,并且,所述呼叫分类属性包括以下中的至少一者:词、n元语法、词嵌入、词袋。


6.如权利要求3所述的方法,其中,所拦截的所述语音呼叫的情绪成分基于以下中的至少一者而是积极的或消极的:(i)将文本分解成词或词序列的规则,所述词或词序列具有预先指定的积极或消极的评价;(ii)词汇表,其中对来自预先编译的词汇表的积极词和消极词的数量进行计数;(iii)机器学习。


7.如权利要求3所述的方法,其中,使用一组预先选择的音素串来确定所述机器人化的语音的存在。


8.如权利要求1所述的方法,其中,对所拦截的语音呼叫进行分类还包括使用基于一组具有特征的预先选择的语音呼叫的经训练的分类模型。


9.如权利要求8所述的方法,其中,所述经训练的分类模型基于以下中的至少一者:朴素贝叶斯分类器、逻辑回归、马尔可夫随机场分类器、支持向量机、k最近邻、和/或决策树。


10.如权利要求1所述的方法,还包括向所述接收设备发送通知,其中,所述通知指示所拦截的语音呼叫的分类类别。


11.一种用于分析和分类语音呼叫的系统,所述系统包括:
硬件处理器,所述硬件处理器被配置为:
拦截发起设...

【专利技术属性】
技术研发人员:尼古拉·A·切拉耶夫安德烈·I·戈鲁别夫
申请(专利权)人:卡巴斯基实验室股份制公司
类型:发明
国别省市:俄罗斯;RU

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1