一种用于听障人士的沟通系统、接听拨打方法及通讯系统技术方案

技术编号:29497633 阅读:35 留言:0更新日期:2021-07-30 19:10
本发明专利技术提供了一种用于听障人士的沟通系统,其特征在于,由下至上依次包括:接入层:用于对接语音中继接口以及服务接口;数据层:用于保存用户数据,用户数据包括通话信息和用户个性化配置信息;服务层:包括AI服务和业务系统服务,所述AI服务采用流式决策引擎,所述业务系统服务包括语音处理模块和信息推送模块;应用层:应用以不同形式集成在前端应用中。利用人工智能技术提供一种适合于聋哑身障人士进行无障碍沟通的通信方式,解决接听电话、拨打电话、对话沟通的问题;针对聋哑人交流沟通时遇到的手语不普及、专业设备较贵等问题,在现有的即时通信方式下,利用智能语音技术来解决聋哑人的听和说的难题。

【技术实现步骤摘要】
一种用于听障人士的沟通系统、接听拨打方法及通讯系统
本专利技术涉及一种用于听障人士的沟通系统、接听拨打方法及通讯系统。
技术介绍
对聋哑人来说,手语是他们母语,能够使用手语无障碍地即时远程通讯一直都是聋人的梦想。视频电话技术的发展使聋人之间的远程通信成为可能。2010年,苹果公司在iphone4上推出了免费的FaceTime功能,为了宣传FaceTime强大的视频通话技术,苹果公司在中国专门拍摄了聋人使用iPhone4的FaceTime打视频电话的广告。后来,这一功能在不同品牌的智能手机上都得到了实现。2006年,南京残联推出了一款专门为聋人开发的“无障碍信息电话机”,在现有的固定电话线上使用,不改变号码,也不影响原来电话的所有功能,唯一的区别就是,在电话机最下方多了一块区域,上面有一块小屏幕以及几个按键,使其具有发短信的功能。2011年,黑龙江大兴安岭地区一所小学的退休教师张林茂对上述仅支持发送短信的电话机进行了升级,专利技术出一种名为“龙人通”的电话机,聋人在电话机键盘上输入文字,电话机可以自动将其转化成语音,如果接电话的一方使用“龙人通”,对方传来的语音可以被转化成文字显示在屏幕上,从而实现了聋人之间、聋听之间的即时沟通。智能语音技术背景。1、聋哑人的听(语音转文本)自动语音识别(ASR)是一种将口语转换为文本的过程。该技术正在不断应用于即时通讯应用程序、搜索引擎、车载系统和家庭自动化中。尽管所有这些系统都依赖于略有不同的技术流程,但这些所有系统的第一步都是相同的:捕获语音数据并将其转换为机器可读的文本。从基础层面来看,自动语音识别看起来如下:音频数据输入,文本数据输出。但是,从输入到输出,音频数据需要变成机器可读的数据。这意味着数据通过声学模型和语言模型进行发送。这两个过程是这样的:声学模型确定了语言中音频信号和语音单位之间的关系,而语言模型将声音与单词及单词序列进行匹配。这两个模型允许ASR系统对音频输入进行概率检查,以预测其中的单词和句子。然后,系统会选出具有最高置信度等级的预测。ASR技术已融身于社会。虚拟助手、车载系统和家庭自动化都让日常生活更加便利,应用范围也可能扩大。随着越来越多的人接纳这些服务,技术将进一步发展。2、聋哑人的说(文本转语音)TTS技术本质上解决的是「从文本转化为语音的问题」,通过这种方式让机器开口说话。语音合成,又称文语转换(TexttoSpeech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。我们所说的“让机器像人一样开口说话”与传统的声音回放设备(系统)有着本质的区别。传统的声音回放设备(系统),如磁带录音机,是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。语音合成技术经历了一个逐步发展的过程,从参数合成到拼接合成,再到两者的逐步结合,其不断发展的动力是人们认知水平和需求的提高。它们各有优缺点,人们在应用过程中往往将多种技术有机地结合在一起,或将一种技术的优点运用到另一种技术上,以克服另一种技术的不足。而上述传统方式存在一定缺陷,具体如下所示。1、手语识别困难,且受众面较窄。由于手语需要连续的运动图像,所以哪怕是最先进的可视电话所显示的快速变换的图像,也无法满足聋哑人交流的需要。手语识别的新专利技术经常见诸报端,它可以分为两个大类。第一类是基于可穿戴设备的手语识别技术。使用者佩戴具有特定功能的手套、手环或指环等可穿戴设备,打手势时,设备上的传感器可以采集手势运动的三维数据并传送至计算机进行分析解码,输出为文字。第二类被称为“基于视觉的手语识别技术”。使用者徒手拍摄出手语视频,计算机通过识别肤色、运动、手形等特征识别视频中的手语,进行数据采集和分析,这种方法的技术难度较大。手语识别技术目前仍在探索阶段,成形的产品尚未面市。2、专用沟通设备不够便利,且造价较贵。适用于聋哑人的通话设备通常需要专业定制的设计和制造,有些甚至需要接插摄像机。这样的设备设计制造成本较高,售卖价格不菲。语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。3、接听时主要是沟通时的实时性不够强,类似微信增加的“语音转文字”功能,虽然为聋哑人与常人的沟通提供了很大的便利,不过,这种转码需要等待对方说完整句话,同时还有选择转码之后才能看到对方说话的文本,况且这种转码还常常存在误差,准确性有待提高。4、说话风格不够丰富当前语音合成出来的声音的不够丰富,而且通常还带有比较浓的系统合成音的感觉,没有提供丰富的说话风格。5、文字输入较慢,不够快速响应。借助于语音合成技术,可以让文字变成声音播放出来。但是实际在交流的时候,逐字将文字输入进来,速度比较慢的,会对交流过程产生割裂感。
技术实现思路
为了解决上述问题,本专利技术提供了一种用于听障人士的沟通系统、接听拨打方法及通讯系统,利用人工智能技术提供一种适合于聋哑身障人士进行无障碍沟通的通信方式,解决接听电话、拨打电话、对话沟通的问题;针对聋哑人交流沟通时遇到的手语不普及、专业设备较贵等问题,在现有的即时通信方式下,利用智能语音技术来解决聋哑人的听和说的难题。本专利技术的技术方案如下所示:一种用于听障人士的沟通系统,由下至上依次包括:接入层:用于对接语音中继接口以及服务接口;数据层:用于保存用户数据,用户数据包括通话信息和用户个性化配置信息;服务层:包括AI服务和业务系统服务,所述AI服务采用流式决策引擎,所述业务系统服务包括语音处理模块和信息推送模块;应用层:应用以不同形式集成在前端应用中。优选的,所述接入层的服务接口包括ASR/TTS接口,所述接入层还包括业务数据接口、业务管理接口。优选的,所述数据层包括用于存储用户数据的对象存储、Redis和MySQl,所述用户个性化配置信息包括开场白、场景自定义回复、自定义录音,所述通话信息包括通话时长、主被叫人。优选的,所述流式决策引擎的功能动作管理、连续对话策略、语义理解、命名实体识别和主题分析,所述业务系统服务中还包括号码管理模块、业务统计模块、用户设置模块、话术优化模块、事件感知模块。优选的,所述动作管理的功能为呼转来电事件的处理和通话会话的管理,所述连续对话策略服务通过AI模型智能决策对话动作。优选的,所述前端应用为微信公众号页面、微信小程序中的一种,所述应用层还包括电话接听、对话技本文档来自技高网
...

【技术保护点】
1.一种用于听障人士的沟通系统,其特征在于,由下至上依次包括:/n接入层:用于对接语音中继接口以及服务接口;/n数据层:用于保存用户数据,用户数据包括通话信息和用户个性化配置信息;/n服务层:包括AI服务和业务系统服务,所述AI服务采用流式决策引擎,所述业务系统服务包括语音处理模块和信息推送模块;/n应用层:应用以不同形式集成在前端应用中。/n

【技术特征摘要】
20200930 CN 20201105874741.一种用于听障人士的沟通系统,其特征在于,由下至上依次包括:
接入层:用于对接语音中继接口以及服务接口;
数据层:用于保存用户数据,用户数据包括通话信息和用户个性化配置信息;
服务层:包括AI服务和业务系统服务,所述AI服务采用流式决策引擎,所述业务系统服务包括语音处理模块和信息推送模块;
应用层:应用以不同形式集成在前端应用中。


2.根据权利要求1所述的用于听障人士的沟通系统,其特征在于,所述接入层的服务接口包括ASR/TTS接口,所述接入层还包括业务数据接口、业务管理接口。


3.根据权利要求1所述的用于听障人士的沟通系统,其特征在于,所述数据层包括用于存储用户数据的对象存储、Redis和MySQl,所述用户个性化配置信息包括开场白、场景自定义回复、自定义录音,所述通话信息包括通话时长、主被叫人。


4.根据权利要求1所述的用于听障人士的沟通系统,其特征在于,所述流式决策引擎的功能动作管理、连续对话策略、语义理解、命名实体识别和主题分析,所述业务系统服务中还包括号码管理模块、业务统计模块、用户设置模块、话术优化模块、事件感知模块。


5.根据权利要求4所述的用于听障人士的沟通系统,其特征在于,所述动作管理的功能为呼转来电事件的处理和通话会话的管理,所述连续对话策略服务通过AI模型智能决策对话动作。


6.根据权利要求4所述的用于听障人士的沟通系统,其特征在于,所述前端应用为微信公众号页面、微信小程序中的一种,所述应用层还包括电话接听、对话技能卡法和数据报表。


7.一种用于听障人士的接听电话的方法,基于权利要求1-6中所述的用于听障人士的沟通系统,其特征在于,包括以下步骤:
S1:用户接收到电话呼入,利用沟通系统配置、启用呼叫转移功能;
S2:将呼入电话转移至预先设置的特殊服务号码中,由自然语言引擎;
S3:由接入层从特殊服务号码的通信线路中接收呼入信息并转发至服务层;
S4:由服务层中的流式决策引擎对是否接听呼入电话进行判断,若判断为接听则建立通话,确定开场白内容并将该内容合成为语言进行播放,反之则结束通话;
S5:主叫方的语音信息通...

【专利技术属性】
技术研发人员:彭黔平闵楠
申请(专利权)人:杭州方得智能科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利