用于感测语音结束的方法和实现该方法的电子设备技术

技术编号:22027303 阅读:55 留言:0更新日期:2019-09-04 02:44
提供了一种装置和方法,该装置的各种实施例包括:麦克风;存储器;以及处理器,所述处理器功能地连接到所述麦克风或所述存储器,其中,所述处理器被配置为:基于语音输入对结束点检测(EPD)时间进行计数;当所述EPD时间到期时,确定所述语音输入的最后的词语是否对应于存储在所述存储器中的先前配置的词语;以及,如果所述最后的词语对应于所述先前配置的词语,则延长所述EPD时间并等待接收语音输入。另外,其他实施例也是可能的。

A Method for Sensing Speech End and the Electronic Equipment for Implementing the Method

【技术实现步骤摘要】
【国外来华专利技术】用于感测语音结束的方法和实现该方法的电子设备
各种实施例涉及用于感测语音结束的方法和装置。
技术介绍
随着近来数字技术的增强,诸如移动通信终端、个人数字助理(PDA)、电子调度器、智能手机、平板个人计算机(PC)、可穿戴设备等各种类型的电子设备得到了广泛的应用。为了支持和增加这些电子设备的功能,电子设备的硬件部件和/或软件部件正在不断发展。电子设备使用语音识别技术提供各种服务(或功能)。语音识别技术包括例如用于将由电子设备通过诸如麦克风的声音传感器获得的声学语音信号转换为词语或句子的技术。语音识别技术通常在提取声学语音信号之后执行去除噪声的操作,然后通过提取声学语音信号的特征并将这些特征与语音模型数据库(DB)进行比较来执行语音识别。电子设备基于语音识别技术提供各种语音服务(或语音识别服务)。根据实施例,电子设备基于用户的语音命令来提供各种生活便利服务,例如移动搜索、日程管理、呼叫、备忘录或音乐播放。
技术实现思路
技术问题电子设备可以以各种交互方法激活(操作)语音服务。例如,用于激活语音服务的交互方法可以是下列中的至少一种:触摸唤醒方法,语音唤醒方法或一键通,以及手势或面部/眼睛跟踪唤醒方法。大多数不使用一键通方法的语音服务使用结束点检测(EPD)方法。EPD方法可以指检测用户的语音输入的结束。例如,如果确定用户的语音强度小于或等于阈值超过了预定时间,则电子设备可以识别出用户的语音结束并且可以将识别出的信息发送到服务器(例如,语音识别服务器)以处理该信息。或者,如果在麦克风开启之后在预定时间(例如,3秒、5秒)内没有接收到用户输入,则电子设备可以确定用户想要结束语音输入,并且可以不接收语音输入。然而,当EPD仅与时间或声学语音信息一起使用时,即使用户不想结束语音输入,电子设备也可能不接收语音输入或者可能终止语音服务。各种实施例提供了一种方法和装置,其以各种方法(诸如使用电子设备的场境(或状态)、用户的特征、预定词语(例如,虚词、连接词、等待指令等)或预定手势)分析用户结束(或完成)语音的意图,并确定语音输入是否结束。问题的解决方案根据各种实施例,一种电子设备可以包括:麦克风;存储器;以及处理器,所述处理器功能地连接到所述麦克风或所述存储器,所述处理器可以被配置为:基于语音输入对EPD时间进行计数;当所述EPD时间到期时,确定所述语音输入的最后的词语是否对应于存储在所述存储器中的预定词语;以及当所述最后的词语对应于所述预定词语时,延长所述EPD时间,并等待接收语音输入。根据各种实施例,一种电子设备的操作方法可以包括:基于语音输入对EPD时间进行计数;当所述EPD时间到期时,确定所述语音输入的最后的词语是否对应于存储在存储器中的预定词语;以及当所述最后的词语对应于所述预定词语时,延长所述EPD时间,并等待接收语音输入。专利技术的有益效果根据各种实施例,可以以各种确定方法(诸如使用电子设备的场境(或状态)、用户的特征、预定的词语(例如,虚词、连接词、等待指令等)或预定手势)分析用户结束(或完成)语音的意图,并且能够确定语音输入是否结束。根据各种实施例,当因为用户没有想到确切的词语,用户的意图不清楚,或者用户不知道语音服务可以执行什么功能,用户犹豫时,能够通过理解用户结束语音的意图并延长EPD时间直到用户的语音输入完成,增强用户便利性。根据各种实施例,用户在讲话时电子设备不结束语音服务或者不停止语音识别(例如,接收语音输入),并且等待直到用户输入语音,使得能够提供更舒适的语音服务对话体验。根据各种实施例,通过学习收集与所有的用户对应的通用词(或语言)或对用户特定的个人词语(或语言),使得基于通用词和个人词语,能够更精确地确定用户结束语音的意图。根据各种实施例,通过根据用户希望执行来接收语音服务的应用的特征或用户的个人特征来改变EPD时间或EPD延长时间,可以更精确地确定用户结束语音的意图。附图说明图1是示出根据各种实施例的网络环境中的电子设备的视图。图2是示出根据各种实施例的电子设备的配置的框图。图3是示出根据各种实施例的程序模块的框图。图4是示意性地示出根据各种实施例的电子设备的配置的视图。图5a或图5b是示出根据各种实施例的电子设备的操作方法的流程图。图6a至图6c是示出根据各种实施例的用户界面的示例的视图。图7是示出根据各种实施例的用于在电子设备中收集个人词语的方法的流程图。图8a至8c是示出根据各种实施例的在电子设备中收集个人语言信息的示例的视图。图9是示出根据各种实施例的用于在电子设备中感测语音结束的方法的流程图。图10是示出根据各种实施例的用于在电子设备中感测语音结束的方法的另一流程图。图11是示出根据各种实施例的在电子设备中确定句子是否完成的示例的视图。图12是示出根据各种实施例的通过使用用户结束的意图来感测语音结束的方法的流程图。图13是示出根据各种实施例的用于根据场境信息来控制EPD时间的方法的流程图。图14是示出根据各种实施例的电子设备的示例的视图。具体实施方式在下文中,将参考附图描述本公开的各种实施例。然而,应当理解的是,并不意图将本公开限制于本文公开的特定形式;相反,本公开应当被解释为涵盖本公开的实施例的各种修改、等同形式和/或替代物。在描述附图时,相似的附图标记可用于表示相似的组成元件。除非上下文另有明确说明,否则单数形式也可以包括复数形式。在本公开中,表述“A或B”或“A或/和B中的至少一个”可以包括所列项目的所有可能组合。在本公开的各种实施例中使用的表述“第一”、“第二”、“所述第一”或“所述第二”可以不用管顺序和/或重要性来修饰各种组件,而不会限制相应的组件。当元件(例如,第一元件)被称为(可操作地或通信地)“连接”或“耦接”到另一元件(例如,第二元件)时,它可以直接连接或直接耦接到另一元件,或者任何其他元件(例如,第三元件)可以是它们之间的插入物。在本公开中使用的表述“被配置为”例如可以根据情况与“适合于”、“具有……的能力”、“设计为”、“适应于”、“用作”或“能够……”交换。术语“被配置为”可能不一定意味着在硬件方面“专门设计为”。或者,在某些情况下,表述“被配置为……的设备”可以表示该设备与其他设备或组件一起“能够……”。例如,短语“适应于(或被配置为)执行A、B和C的处理器”可以表示仅用于执行相应操作的专用处理器(例如,嵌入式处理器),或能够通过执行存储在存储设备中的一个或更多个软件程序来执行相应的操作的通用处理器(例如,中央处理单元(CPU)或应用处理器(AP))。根据本公开各种实施例的电子设备可以包括以下项中的至少一个:例如智能手机、平板个人计算机(PC)、移动电话机、视频电话机、电子书阅读器、台式PC、膝上型PC、上网本计算机、工作站、服务器、个人数字助理(PDA)、便携式多媒体播放器(PMP)、MPEG-1音频层-3(MP3)播放器、移动医疗设备、相机和可穿戴设备。根据各种实施例,可穿戴设备可以包括以下项中的至少一个:配饰类(例如,手表、戒指、手镯、脚镯、项链、眼镜、隐形眼镜或头戴式设备(HMD)))、织物或服装整合型(例如,电子服装)、身体安装型(例如,皮肤垫或纹身)和生物可植入型(例如,可植入电路)。根据一些实施例,电子设备可以是家用电器。家用电器本文档来自技高网...

【技术保护点】
1.一种电子设备,所述电子设备包括:麦克风;存储器;以及处理器,所述处理器功能地连接到所述麦克风或所述存储器,其中,所述处理器被配置为:基于语音输入,对结束点检测EPD时间进行计数;当所述EPD时间到期时,确定所述语音输入的最后的词语是否对应于存储在所述存储器中的预定词语;以及当所述最后的词语对应于所述预定词语时,延长所述EPD时间,并等待接收语音输入。

【技术特征摘要】
【国外来华专利技术】2017.01.17 KR 10-2017-00079511.一种电子设备,所述电子设备包括:麦克风;存储器;以及处理器,所述处理器功能地连接到所述麦克风或所述存储器,其中,所述处理器被配置为:基于语音输入,对结束点检测EPD时间进行计数;当所述EPD时间到期时,确定所述语音输入的最后的词语是否对应于存储在所述存储器中的预定词语;以及当所述最后的词语对应于所述预定词语时,延长所述EPD时间,并等待接收语音输入。2.根据权利要求1所述的电子设备,其中,所述处理器被配置为:当所述最后的词语对应于包括虚词、连接词或等待指令中的至少一种的预定词语时,延长所述EPD时间。3.根据权利要求1所述的电子设备,其中,所述处理器被配置为:当在所述EPD时间到期之前检测到附加语音输入时,延长所述EPD时间。4.根据权利要求1所述的电子设备,其中,所述预定词语包括通用词和个人词语,并且其中,所述处理器被配置为:确定在语音命令失效之后识别出的语音命令与先前语音命令之间的相似度,并且基于所述相似度来收集所述个人词语。5.根据权利要求4所述的电子设备,其中,所述处理器被配置为:分析所述语音命令与所述先前语音命令之间改变的文本信息,并且当所述改变的文本信息被检测到预定次数或更多时,用所述文本信息更新所述个人词语。6.根据权利要求1所述的电子设备,其中,所述处理器被配置为:当所述EPD时间到期时,确定是否检测到预定手势,并且当检测到所述预定手势时,延长所述EPD时间。7.根据权利要求1所述的电子设备,其中,所述处理器被配置为:当所述EPD时间到期时,确定根据所述语音输入的句子是否完成,并且当确定所述句子未完成时,延长所述E...

【专利技术属性】
技术研发人员:金龙浩苏拉布·帕特里亚金璇儿朱佳贤黄相雄张世二
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1