一种基于智能耳机的交互方法技术

技术编号:34327005 阅读:58 留言:0更新日期:2022-07-31 01:20
一种基于智能耳机的交互方法,所述方法包括以下步骤:步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机,主要通过自然的语言去激活智能耳机;所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句;步骤2)、智能耳机被激活后,识别唤醒词句,推测用户意图,并通过用户说的词句查询并返回相关信息;步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图确定信息播放方式和速度。本发明专利技术提供了一种基于智能耳机的交互方法,使用非通用的唤醒词句或者某种无线装置,减少用户在有听众情景下的尴尬,形成自然的语言流,针对不同的用户意图改变智能耳机的播放方式和速度。意图改变智能耳机的播放方式和速度。意图改变智能耳机的播放方式和速度。

【技术实现步骤摘要】
一种基于智能耳机的交互方法


[0001]本专利技术涉及智能耳机交互
,尤其是涉及一种基于智能耳机的交互方法。

技术介绍

[0002]智能耳机,主要是指1)蓝牙耳机包括小型话筒和小型扬声器以及与蓝牙耳机连接的终端系统(如智能手机),或者2)微型智能手机包括小型话筒和小型扬声器以及手机的所有其它组件全部制作成耳机的形状,放置在用户的外耳道中,来实现和用户进行声音交互。
[0003]当前的智能耳机技术以及市场上的主要产品,主要局限是:
[0004]1)激活智能耳机的方法:这里的激活是指智能耳机开机以后它在等待用户的某一种声音或者信号来启动接收用户的语音输入。当前的智能耳机技术以及市场上的主要产品的激活方法是:1A)用户需要通过操作手机或者操作智能耳机上面的按钮来激活智能耳机,或者1B) 使用通用的唤醒词(如“小度小度”)来激活智能手机。
[0005]对于1A,用户需要用手进行操作,增加了用户的不便。
[0006]对于1B,随着大公司的手机和语音交互智能助手的普及(如苹果手机的Siri,小米手机的小爱同学,小度在家的小度小度等),通用的唤醒词经常会被用户附近的其他听众所熟知(比如“小爱同学”,“小度小度”),用户用嘴巴说出相关的通用的唤醒词的时候,在有听众情况下,会体验到一定程度的尴尬并且无法掩饰自己在使用智能助手而获得相关的信息。但是在很多实际情景下,用户是需要在听众不知道自己正在使用智能助手进行相关信息的查询,包括用户给听众讲故事、说笑话、背诵诗歌、唱歌等具体场景。
[0007]2)播放方式和速度方面:当前的智能耳机只是播放用户想要听的内容(如查询内容),不管用户的当前场景,智能耳机播放的速度都是一样的。这种设计在一部分重要的应用场景下会出现问题:当用户在查询信息只给自己听的时候智能耳机播放信息的速度可以是正常的,但是如果用户是需要把听到的信息(如笑话和故事等)要实时说给听众的时候,那么用户所需要的智能耳机播放的句子之间要有一定的停顿,用户才能够有时间把所听到的信息复述给听众。现有的智能耳机的交互方式没有考虑到这一点。
[0008]3)播放内容方面:当前的智能耳机的播放内容一般是基于已有的信息,用户无法自定义或预先上传相关的信息并听取自己上传的内容。

技术实现思路

[0009]为了克服现有智能耳机交互方法存在的缺陷,本专利技术提供了一种基于智能耳机的交互方法,使用非通用的唤醒词句或者某种无线装置,减少用户在有听众情景下的尴尬,形成自然的语言流,针对不同的用户意图改变智能耳机的播放方式和速度。
[0010]本专利技术所采用的技术方案是:
[0011]一种基于智能耳机的交互方法,所述方法包括以下步骤:
[0012]步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机,主要通过自然的语言去激活智能耳机;所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句;所述自然
的语言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机,避免用户在有听众情况下使用通用唤醒词而形成尴尬;
[0013]步骤2)、智能耳机被激活后,识别唤醒词句,推测用户意图,并通过用户说的词句查询并返回相关信息;
[0014]步骤2.1)、当智能耳机被激活后,通过智能耳机的语音激活和识别模块识别这些唤醒词句,并且记录唤醒方式,即通过语音激活还是通过某种无线设备激活,同时智能耳机的声音控制和播放模块将反馈声音或者反馈语音播放给用户,提示用户智能耳机已经收到用户的唤醒词句并等待用户输入词句;比如“我在,请说需要播放什么”。
[0015]步骤2.2)、用户说出含有关键词的词句,比如“李白的诗句”;;
[0016]步骤2.3)、语音激活和识别模块识别用户的词句,并提取用户所说的词句中的关键词;
[0017]步骤2.4)、智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键词查找相关的信息库内容,包括已有的信息库或者用户自建的信息库,同时播放反馈声音或反馈语音,比如“正在查询”。如果能够查询到,则返回查询到的内容和激活的信息库;如果没有查到,则反馈用户未查询到该信息;智能耳机的用户意图推测和信息库服务交互模块会根据用户的关键词来激活并查询相关的信息库,比如关键词是“笑话”则激活笑话库,并返回查询内容和被激活的信息库的名称;如果关键词含有歌曲的相关的信息,比如歌曲的名称、某个歌星的名字、或者歌曲的一句歌词,则激活含有歌曲的信息库,并返回查询内容和被激活的信息库的名称;所述信息库,是指各种文字或者音频含歌曲的信息库,可以是已有建立好的信息库,也可以是用户自己建立的信息库;信息库分为两大类,含有歌曲信息如歌词或歌曲等的音频的称为歌曲库,不含有歌曲信息的称为非歌曲库;非歌曲库具体可以包括但不限于:笑话、故事、诗歌、谜语、脑筋急转弯、情话、美食和烹饪、百科知识、安全和紧急情况处理、问题解决、各种专业知识和词典、人生经验、名言和佳句、对话技巧和建议、旅游信息、健康和疾病诊治、美容瘦身、影视、萌宠、明星、娱乐、体育、科技、家居家装、星座、艺术、历史、地理、军事、新闻等以及用户自建的信息。
[0018]步骤2.5)、该步骤和步骤2.4)同时进行,智能耳机的用户意图推测和信息库服务交互模块根据用户的唤醒智能耳机的方式(通过语音激活还是通过某种无线设备)和唤醒词句(非通用的还是通用的唤醒词句),来推测用户的意图:
[0019]意图1:如果用户说出五类非通用唤醒词句中的一类非通用唤醒词句或者按动某种无线装置,则推测用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌;用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块;
[0020]意图2:如果用户说出的是通用的唤醒词句,如该智能耳机的名称,则推测用户的意图是用户自己查询信息给自己听;用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块;
[0021]步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信息库确定信息播放方式和速度;根据步骤2.5)的结果,如果是意图1:用户是要说或者唱给听众,则进入步骤3.1);如果是意图2,则进入步骤3.4);
[0022]步骤3.1)、通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌
曲库;如果是非歌曲库被激活,进入步骤3.2);如果是歌曲库被激活,则进入步骤3.3);
[0023]步骤3.2)如果是非歌曲库激活,则根据步骤2.4)返回的查询到的内容,智能耳机的声音控制和播放模块将按照以下步骤进行处理:
[0024]第1步,根据文本中标点符号作为切分小句的标记,将段落和句子切分成多个小句;
[0025]第2步,检查每个小句的长度,如果某一个小句的长度超过单个小句最长字数限制参数X,那么就分析该句子的语法结构并自动将该小句切分成多个小句子,并保证切分后的小句子满足以下要求:1)主谓宾尽量完整;2)代词、名词、动词、形容词、副词、词组(如成语)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能耳机的交互方法,其特征在于:所述方法包括以下步骤:步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机,主要通过自然的语言去激活智能耳机;所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句;所述自然的语言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机,避免用户在有听众情况下使用通用唤醒词而形成尴尬;步骤2)、智能耳机被激活后,识别唤醒词句,推测用户意图,并通过用户说的词句查询并返回相关信息;步骤2.1)、当智能耳机被激活后,通过智能耳机的语音激活和识别模块识别这些唤醒词句,并且记录唤醒方式,即通过语音激活还是通过某种无线设备激活,同时智能耳机的声音控制和播放模块将反馈声音或者反馈语音播放给用户,提示用户智能耳机已经收到用户的唤醒词句并等待用户输入词句;步骤2.2)、用户说出含有关键词的词句;步骤2.3)、语音激活和识别模块识别用户的词句,并提取用户所说的词句中的关键词;步骤2.4)、智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键词查找相关的信息库内容,包括已有的信息库或者用户自建的信息库,同时播放反馈声音或反馈语音;如果能够查询到,则返回查询到的内容和激活的信息库;如果没有查到,则反馈用户未查询到该信息的反馈;智能耳机的用户意图推测和信息库服务交互模块会根据用户的关键词来激活并查询相关的信息库,并返回查询内容和被激活的信息库的名称;步骤2.5)、该步骤和步骤2.4)同时进行,智能耳机的用户意图推测和信息库服务交互模块根据用户的唤醒智能耳机的方式和唤醒词句,来推测用户的意图;步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信息库确定信息播放方式和速度。2.如权利要求1所述的一种基于智能耳机的交互方法,其特征在于:所述非通用的唤醒词句包括以下五类:第1类:用户用第一人称说的需要思考或者回忆的词句;第2类:用户用第一人称说的自己可能知道的词句;第3类:用户询问他人的词句;第4类:用户用第一人称说自己将要开始说话或者想告诉他人的词句;第5类:用户自定义唤醒词句。3.如权利要求2所述的一种基于智能耳机的交互方法,其特征在于:所述步骤2.5)中还包括以下步骤:所述用户的意图包括以下两种:意图1:如果用户说出非通用唤醒词句或者按动某种无线装置,则推测用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌;用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块;意图2:如果用户说出的是通用的唤醒词句,则推测用户的意图是用户自己查询信息给自己听;用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块。4.如权利要求3所述的一种基于智能耳机的交互方法,其特征在于:所述步骤3)中还包括以下步骤:根据步骤2.5)的结果,如果是意图1:用户是要说或者唱给听众,则进入步骤3.1);如果是意图2,则进入步骤3.4);
步骤3.1)、通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌曲库;如果是非歌曲库被激活,进入步骤3.2);如果是歌曲库被激活,则进入步骤3.3);步骤3.2)如果是非歌曲库激活,则根据步骤2.4)返回的查询到的内容,智能耳机的声音控制和播放模块将按照以下步骤进行处理:第1步,根据文本中标点符号作为切分小句的标记,将段落和句子切分成多个小句;第2步,检查每个小句的长度,如果某一个小句的长度超过单个小句最长字数限制参数X,那么就分析该句子的语法结构并自动将该小句切分成多个小句子,并保证切分后的小句子满足以下要求:1)主谓宾尽量完整;2)代词、名词、动词、形容词、副词、词组不被切开;3)总字数小于最长字数限制参数X;第3步,播放每小句话后有意停顿N秒,其中N=该句话的字数
×
C;其中参数C为单个小句播放后有意停顿的时间参数,单位是字/秒,用户第一次使用智能耳机的时候,该参数C有一个缺省值,用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参数的值。步骤3.3)、如果是歌曲库被激活,通过步骤2.4)获得的用户词句的和歌曲库中查询的结果,分为两种情况:情况1:如果能够查询到该歌曲的音频,则播放音频;情况2:如果只能查询到该歌曲的歌词:情况2A)若智能耳机的语音激活和识别模块可以准确识别用户当前的歌唱进度,则声音控制和播放模块将提前M秒向用户播放该首歌的下一句歌词,M为播放歌词的提前时间,单位是秒,智能耳机出厂时有缺省值,用户可以通过智能耳机的用户自定义和输入模块进行调整;情况2B)若智能耳机无法识别用户的歌唱进度或者识别错误较高,则根据该歌曲的歌词播放表含每句歌词的播放时间来播放歌词;步骤3.4):如果用户的唤醒词句是本智能耳机的名称,即通用的唤醒词,则推测用户的意图是用户自己查询信息给自己听;智能耳机将用正常速度播放这些声音:如果是非歌曲库被激活,单个小句播放后有意停顿的时间参数C为0;如果是播放歌曲库中的歌词,则M=0。5.如权利要求4所述的一种基于智能耳机的交互方法,其特征在于:所述交互方法还包括以下步骤:步骤4)、用户通过关键词对智能耳机的播放进行控制:用户可以通过以下的比较自然的语音交互方式来控制智能耳机的播放;情况1:如果对...

【专利技术属性】
技术研发人员:丹尼尔
申请(专利权)人:心行者科技杭州有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1