System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息处理设备、信息处理方法和程序技术_技高网

信息处理设备、信息处理方法和程序技术

技术编号:41308718 阅读:5 留言:0更新日期:2024-05-13 14:53
根据本技术的一个实施方式的信息处理设备包括:获取单元;确定单元;和控制单元。获取单元获取通过语音识别将说话者的语音转换成字符而获得的字符信息。确定单元基于说话者的状态,确定说话者试图借助于字符信息将说话者自己的语音的内容传达给接收者的说话者进行交流的意图的存在或不存在。控制单元执行将字符信息显示在由说话者和接收者各自使用的显示装置上的处理,以及向说话者和/或接收者呈现与进行交流的意图相关的确定结果的处理。

【技术实现步骤摘要】
【国外来华专利技术】

本技术涉及可以应用于使用语音识别的交流工具等的信息处理设备、信息处理方法和程序


技术介绍

1、在相关技术中,已经开发了通过使用语音识别将话语内容显示为字符来支持交流的技术。例如,专利文献1公开了通过相互显示使用语音识别的翻译结果来支持交流的系统。在该系统中,通过语音识别获取一个用户的语音,并且将通过对内容进行翻译获取的字符显示给另一用户。在这样的系统中,例如,在呈现大量的翻译结果的情况下,接收者侧的读取等可能赶不上。出于该原因,根据专利文献1,根据接收者侧的情况,向说话者侧发出通知以使其暂时停止说话(专利文献1,段落[0084]、[0143]、[0144]、[0164]、图28等)。

2、引用列表

3、专利文献

4、专利文献1:pct国际公布第2017/191713号


技术实现思路

1、技术问题

2、以这种方式,在通过经由语音识别获取的字符进行交流的情况下,取决于使用工具的方式,交流可能受到阻碍。出于该原因,需要用于实现使用语音识别的顺畅交流的技术。

3、鉴于上述情况,本技术的目的是提供能够实现使用语音识别的顺畅交流的信息处理设备、信息处理方法和程序。

4、问题的解决方案

5、为了实现上述目的,根据本技术的实施方式的信息处理设备包括获取部、确定部和控制部。

6、获取部获取通过经由语音识别将说话者的话语转换成字符而获得的字符信息。

7、确定部基于说话者的状态,确定说话者试图使用字符信息将说话者自己的话语内容传达给接收者的传达意图的存在或不存在。

8、控制部执行将字符信息显示在由说话者和接收者各自使用的显示装置上的处理,以及将关于传达意图的确定结果呈现给说话者和接收者中的至少一者的处理。

9、根据该信息处理设备,说话者的话语通过语音识别被转换成字符,并且作为字符信息显示在说话者和接收者二者上。此时,基于说话者的状态,确定说话者试图使用字符信息将话语内容传达给接收者的传达意图是否存在,并且将确定结果呈现给说话者或接收者。因此,例如,可以促使说话者在确认字符信息的同时说话,或者可以向接收者传达诸如是否关注字符信息之类的信息。因此,可以实现使用语音识别的顺畅交流。

10、在确定传达意图不存在的情况下,控制部可以生成用于向说话者和接收者中的至少一者通知传达意图不存在的通知数据。

11、通知数据可以包括视觉数据、触觉数据和声音数据中的至少一个。

12、信息处理设备还可以包括:视线检测部,该视线检测部检测说话者的视线;以及视线确定部,该视线确定部基于说话者的视线的检测结果,确定说话者的视线是否偏离在说话者所使用的显示装置中显示有字符信息的区域。在这种情况下,在说话者的视线偏离显示有字符信息的区域的情况下,确定部可以开始传达意图的确定处理。

13、确定部可以基于说话者的视线、说话者的语音速度、说话者的音量、说话者的头部方向或说话者的手的位置中的至少一个来执行传达意图的确定处理。

14、在说话者的视线偏离显示有字符信息的区域的状态持续预定时间的情况下,确定部可以确定传达意图不存在。

15、确定部可以基于说话者的视线和接收者的视线来执行传达意图的确定处理。

16、在说话者的视线偏离显示有字符信息的区域的情况下,控制部可以执行使说话者的视野难以看到的处理。

17、控制部可以基于语音识别的可靠性、说话者的语音速度、说话者的视线的运动趋势或说话者周围的噪声水平中的至少一个来设置使说话者的视野难以看到的速度。

18、由说话者使用的显示装置可以是透射式显示装置。在这种情况下,控制部可以执行以下处理中的至少一个作为使说话者的视野难以看到的处理:降低透射式显示装置的至少一部分的透明度的处理,或者在透射式显示装置上显示遮挡说话者的视野的对象的处理。

19、在说话者的视线返回至显示有字符信息的区域的情况下,控制部可以取消使说话者的视野难以看到的处理。

20、在确定传达意图不存在的情况下,控制部可以在由说话者使用的显示装置中显示字符信息以与说话者的视线相交。

21、在确定传达意图不存在的情况下,控制部可以执行关于语音识别的抑制处理。

22、控制部可以停止语音识别处理或者可以停止在由说话者和接收者各自使用的显示装置中的至少一个上显示字符信息的处理,作为抑制处理。

23、在确定传达意图存在的情况下,控制部可以向至少接收者呈现传达意图存在。

24、信息处理设备还可以包括虚拟信息生成部,该虚拟信息生成部生成如下虚拟信息:即使说话者的语音不存在,说话者也看起来在说话。在这种情况下,控制部可以在确定传达意图存在的时间段期间将虚拟信息显示在由接收者使用的显示装置上,直到通过语音识别获取了指示说话者的话语内容的字符信息。

25、虚拟信息可以包括以下中的至少一个:说话者看起来正在说话的虚拟效果的信息,或者字符信息看起来要被输出的虚拟字符串的信息。

26、根据本技术实施方式的信息处理方法是由计算机系统执行的信息处理方法,并且包括获取通过经由语音识别将说话者的话语转换成字符而获得的字符信息。

27、基于说话者的状态,确定说话者试图使用字符信息将说话者自己的话语内容传达给接收者的传达意图的存在或不存在。

28、执行将字符信息显示在由说话者和接收者各自使用的显示装置上的处理。

29、执行将关于传达意图的确定结果呈现给说话者和接收者中的至少一者的处理。

30、根据本技术的实施方式的程序使计算机系统执行以下步骤:

31、获取字符信息,该字符信息是通过经由语音识别将说话者的话语转换成字符而获得的,

32、基于说话者的状态,确定说话者试图使用字符信息将说话者自己的话语内容传达给接收者的传达意图的存在或不存在,

33、执行将字符信息显示在由说话者和接收者各自使用的显示装置上的处理,以及

34、执行将关于传达意图的确定结果呈现给说话者和接收者中的至少一者的处理。

本文档来自技高网...

【技术保护点】

1.一种信息处理设备,包括:

2.根据权利要求1所述的信息处理设备,其中,

3.根据权利要求2所述的信息处理设备,其中,

4.根据权利要求1所述的信息处理设备,还包括:

5.根据权利要求4所述的信息处理设备,其中,

6.根据权利要求5所述的信息处理设备,其中,

7.根据权利要求5所述的信息处理设备,其中,

8.根据权利要求4所述的信息处理设备,其中,

9.根据权利要求8所述的信息处理设备,其中,

10.根据权利要求8所述的信息处理设备,其中,

11.根据权利要求8所述的信息处理设备,其中,

12.根据权利要求1所述的信息处理设备,其中,

13.根据权利要求1所述的信息处理设备,其中,

14.根据权利要求13所述的信息处理设备,其中,

15.根据权利要求1所述的信息处理设备,其中,

16.根据权利要求15所述的信息处理设备,还包括:

17.根据权利要求16所述的信息处理设备,其中,

>18.一种由计算机系统执行的信息处理方法,包括:

19.一种使计算机系统执行以下步骤的程序:

...

【技术特征摘要】
【国外来华专利技术】

1.一种信息处理设备,包括:

2.根据权利要求1所述的信息处理设备,其中,

3.根据权利要求2所述的信息处理设备,其中,

4.根据权利要求1所述的信息处理设备,还包括:

5.根据权利要求4所述的信息处理设备,其中,

6.根据权利要求5所述的信息处理设备,其中,

7.根据权利要求5所述的信息处理设备,其中,

8.根据权利要求4所述的信息处理设备,其中,

9.根据权利要求8所述的信息处理设备,其中,

10.根据权利要求8所述的信息处理设备,其...

【专利技术属性】
技术研发人员:河野真一井上直树川野由贵岩濑广山崎贵义
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1