【技术实现步骤摘要】
【国外来华专利技术】自动阻止音频流中包含的敏感数据
本公开涉及语音识别,并且更具体而言,涉及音频流中包含的敏感数据的自动阻止。
技术介绍
自动语音识别是用于将已经由计算机或系统接收的诸如口语之类的音频信号转换为文本的过程。通过使用语音到文本引擎来实现此转换,该引擎使用通过计算机程序实现的算法来自动基于音频信号生成文本序列。当客户呼叫呼叫中心时,他们有时会提供个人信息,例如信用卡号或社会保险号。问题是,呼叫者如何知道他们向其提供信息的人是可信赖的?大多数呼叫中心确实有由员工签署的协议,并对恶意员工采取法律措施。大多数呼叫中心都有主管和摄像头。但是,这些都是昂贵且不可靠的解决方案,远非万无一失。此外,它们在采取事实措施之后(例如,如果员工被抓住,则员工必须违反规则才能被抓住。)因此,在本领域中需要解决前述问题。
技术实现思路
从第一方面来看,本专利技术提供了一种用于阻止音频流中的敏感信息的系统,该系统包括:至少一个处理器;以及至少一个存储组件;具有一个或多个口语的音频流;敏感词表;至少一个语音到文本引擎,被配置为 ...
【技术保护点】
1.一种用于阻止音频流中的敏感信息的系统,该系统包括:/n至少一个处理器;/n至少一个存储组件;/n具有一个或多个口语的音频流;/n敏感词表;/n至少一个语音到文本引擎,被配置为将所述音频流解码为文本;/n敏感词检测引擎,被配置为通过文本串中的词与所述敏感词表进行匹配,分析所述文本以得到指示敏感信息的所述文本串;和/n阻止引擎,其被配置为当从所述音频流中检测到匹配于所述敏感词表的单词时阻止所述音频流。/n
【技术特征摘要】
【国外来华专利技术】20171128 US 15/824,0511.一种用于阻止音频流中的敏感信息的系统,该系统包括:
至少一个处理器;
至少一个存储组件;
具有一个或多个口语的音频流;
敏感词表;
至少一个语音到文本引擎,被配置为将所述音频流解码为文本;
敏感词检测引擎,被配置为通过文本串中的词与所述敏感词表进行匹配,分析所述文本以得到指示敏感信息的所述文本串;和
阻止引擎,其被配置为当从所述音频流中检测到匹配于所述敏感词表的单词时阻止所述音频流。
2.根据权利要求1所述的系统,其中,所述音频流是在电话呼叫期间记录的口语。
3.根据前述权利要求中的任一项所述的系统,其中,所述敏感信息是从包括以下各项信息的组中选择的:财务信息、健康信息、信用信息、密码信息、身份信息和位置信息。
4.根据前述权利要求中的任一项所述的系统,其中,所述分析包括将所述文本与已知敏感触发词的列表进行比较。
5.根据前述权利要求中的任一项所述的系统,其中,所述文本串包括敏感信息。
6.根据权利要求5所述的系统,其中,所述文本串包括通常在敏感信息之前出现的一个或多个单词。
7.根据前述权利要求中的任一项所述的系统,其中,选择满足或超过精度阈值的语音到文本引擎。
8.一种用于阻止音频流中的敏感信息的方法,所述方法包括:
从音频馈送中接收所述音频流,所述音频流具有口语;
使用至少一个语音到文本引擎将所...
【专利技术属性】
技术研发人员:JA施密特,AD布雷厄姆,J尼古莱,J桑托斯沃索,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。