System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于注视的听写制造技术_技高网
当前位置: 首页 > 专利查询>苹果公司专利>正文

基于注视的听写制造技术

技术编号:41201464 阅读:7 留言:0更新日期:2024-05-07 22:27
提供了用于基于注视来操作智能听写系统的系统和过程。一种示例性方法包括:在具有一个或多个处理器以及存储器的电子设备处,检测用户的注视;基于该用户的被检测到的注视来确定是否进入听写模式;以及根据确定进入该听写模式:接收话语;基于该用户的被检测到的注视和该话语来确定是否进入编辑模式;以及根据确定不进入该编辑模式,在该电子设备的屏幕上显示该话语的文本表示。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术整体涉及听写系统,并且更具体地,涉及利用用户注视来改进听写系统的听写和编辑。


技术介绍

1、听写服务可以向不能访问或键入屏幕、键盘或电子设备的其他输入的用户提供益处。听写语音然后转录也可以比键入更快,并且向用户提供方便的交互以在执行动作时插入文本。然而,听写也可能在语音的识别和对用户是否正打算听写的确定中出现错误。因此,需要确定用户是否正在听写以及用户何时打算编辑听写语音的有效方式。


技术实现思路

1、本文公开了示例性方法。一种示例性方法包括:在具有一个或多个处理器以及存储器的电子设备处,检测用户的注视;基于该用户的被检测到的注视来确定是否进入听写模式;以及根据对进入该听写模式的确定:接收话语;基于该用户的被检测到的注视和该话语来确定是否进入编辑模式;以及根据对不进入该编辑模式的确定,在该电子设备的屏幕上显示该话语的文本表示。

2、本文公开了示例非暂态计算机可读介质。一种示例性非暂态计算机可读存储介质存储一个或多个程序。该一个或多个程序包括指令,这些指令用于:检测用户的注视;基于该用户的被检测到的注视来确定是否进入听写模式;以及根据对进入该听写模式的确定:接收话语;基于该用户的被检测到的注视和该话语来确定是否进入编辑模式;以及根据对不进入该编辑模式的确定,在该电子设备的屏幕上显示该话语的文本表示。

3、本文公开了示例电子设备。一种示例电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中该一个或多个程序被存储在该存储器中并且被配置为由该一个或多个处理器执行,该一个或多个程序包括指令,这些指令用于:检测用户的注视;基于该用户的被检测到的注视来确定是否进入听写模式;以及根据对进入该听写模式的确定:接收话语;基于该用户的被检测到的注视和该话语来确定是否进入编辑模式;以及根据对不进入该编辑模式的确定,在该电子设备的屏幕上显示该话语的文本表示。

4、一种示例性电子设备包括:用于检测用户的注视的装置;用于基于该用户的被检测到的注视来确定是否进入听写模式的装置;以及根据对进入该听写模式的确定:用于接收话语的装置;用于基于该用户的被检测到的注视和该话语来确定是否进入编辑模式的装置;以及根据对不进入该编辑模式的确定,用于在该电子设备的屏幕上显示该话语的文本表示的装置。

5、基于用户的被检测到的注视来确定是否进入听写模式允许转录系统基于用户正在看着哪里来准确地理解用户何时正打算向转录系统听写。具体地,转录系统可以确定用户正在看着屏幕上的哪里,并且因此确定用户是否正在尝试向转录系统听写或者请求执行某一其他任务。另外,基于用户的被检测到的注视和话语来确定是否进入编辑模式允许转录系统更准确地理解用户是否正打算编辑先前听写的字词或提供新的听写。具体地,转录系统可利用话语中的字词以及用户的注视来理解用户是聚焦于先前在电子设备的屏幕上显示的某些内容还是听写内容。这样,转录系统可通过确定用户的意图来更有效地操作,而不需要进一步对话或来自转录系统的其他输出,从而节省电子设备的电池。

6、一种示例性方法包括:在具有一个或多个处理器以及存储器的电子设备处,检测用户的注视;确定用户的注视的方向;以及根据对用户的注视的方向聚焦于在电子设备的屏幕上显示的第一元素的第一位置上的确定,在电子设备的屏幕上显示第二元素。

7、一种示例性非暂态计算机可读存储介质存储一个或多个程序。该一个或多个程序包括指令,这些指令用于:检测用户的注视;确定用户的注视的方向;以及根据对用户的注视的方向聚焦于在电子设备的屏幕上显示的第一元素的第一位置上的确定,在电子设备的屏幕上显示第二元素。

8、一种示例电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中该一个或多个程序被存储在该存储器中并且被配置为由该一个或多个处理器执行,该一个或多个程序包括指令,这些指令用于:检测用户的注视;确定用户的注视的方向;以及根据对用户的注视的方向聚焦于在电子设备的屏幕上显示的第一元素的第一位置上的确定,在电子设备的屏幕上显示第二元素。

9、一种示例性电子设备包括:用于检测用户的注视的装置;用于确定用户的注视的方向的装置;以及根据对用户的注视的方向聚焦于在电子设备的屏幕上显示的第一元素的第一位置上的确定,用于在电子设备的屏幕上显示第二元素的装置。

10、根据对用户的注视的方向聚焦于在电子设备的屏幕上显示的第一元素的第一位置上的确定,在电子设备的屏幕上显示第二元素允许转录系统与用户交互以有效地处理用户命令。具体地,转录系统基于用户的注视来理解用户的意图,并且可以在不向用户确认该意图的情况下向用户提供满足该意图的信息。这样,减少了完成任务所需的输出和输入的数量,从而减少了所需的处理量并且节省了电池。

11、一种示例性方法包括:在具有一个或多个处理器以及存储器的电子设备处,检测用户的注视;确定用户的注视所瞄向的一个或多个字词;基于该一个或多个字词以及用户的注视来确定该一个或多个字词中的字词是否不正确;以及根据对该一个或多个字词中的该字词不正确的确定,在电子设备的屏幕上显示与该字词相关的元素。

12、一种示例性非暂态计算机可读存储介质存储一个或多个程序。该一个或多个程序包括指令,这些指令用于检测用户的注视;确定用户的注视所瞄向的一个或多个字词;基于该一个或多个字词以及用户的注视来确定该一个或多个字词中的字词是否不正确;以及根据对该一个或多个字词中的该字词不正确的确定,在电子设备的屏幕上显示与该字词相关的元素。

13、一种示例电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中该一个或多个程序被存储在该存储器中并且被配置为由该一个或多个处理器执行,该一个或多个程序包括指令,这些指令用于检测用户的注视;确定用户的注视所瞄向的一个或多个字词;基于该一个或多个字词以及用户的注视来确定该一个或多个字词中的字词是否不正确;以及根据对该一个或多个字词中的该字词不正确的确定,在电子设备的屏幕上显示与该字词相关的元素。

14、一种示例性电子设备包括用于检测用户的注视的装置;用于确定用户的注视所瞄向的一个或多个字词的装置;用于基于该一个或多个字词以及用户的注视来确定该一个或多个字词中的字词是否不正确的装置;以及根据对该一个或多个字词中的该字词不正确的确定,用于在电子设备的屏幕上显示与该字词相关的元素的装置。

15、基于该一个或多个字词以及用户的注视来确定该一个或多个字词中的字词是否不正确允许有效地纠正已经被转录系统不正确地转录的字词。具体地,转录系统能够更好地理解用户正在尝试编辑哪个字词,并且因此以用户所需的较少输入来纠正任何错误。这样,用户可以在单个输入中提供对不正确字词的期望纠正,而不需要与一系列菜单交互或多个输入。这减少了转录系统与用户之间所需的总体交互,从而节约了电池。

本文档来自技高网...

【技术保护点】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中确定是否进入所述听写模式是利用第一机器学习模型来确定的,并且确定是否进入所述编辑模式是利用与所述第一机器学习模型不同的第二机器学习模型来确定的。

3.根据权利要求1至2中任一项所述的方法,其中确定是否进入所述听写模式以及确定是否进入所述编辑模式是利用第三机器学习模型来确定的。

4.根据权利要求1至3中任一项所述的方法,其中基于所述用户的被检测到的注视来确定是否进入听写模式还包括:

5.根据权利要求4所述的方法,其中基于所述用户的被检测到的注视来确定是否进入听写模式还包括:

6.根据权利要求4所述的方法,其中确定所述用户的被检测到的注视是否指向在所述电子设备的屏幕上显示的所述文本字段还包括:

7.根据权利要求1至6中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

8.根据权利要求7所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

9.根据权利要求1至8中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

10.根据权利要求1至9中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

11.根据权利要求1至10中任一项所述的方法,还包括:

12.根据权利要求11所述的方法,其中用于在所述电子设备的所述屏幕上显示所述话语的所述文本表示的所述第三位置基于所述用户的注视在所述屏幕上的位置来确定。

13.根据权利要求11所述的方法,其中用于在所述电子设备的所述屏幕上显示所述话语的所述文本表示的所述第三位置基于在所述电子设备的所述屏幕上显示的文本的末尾来确定。

14.根据权利要求1至13中任一项所述的方法,还包括:

15.根据权利要求14所述的方法,其中基于所述用户的被检测到的注视、所述用户的被检测到的注视的位置与所述字词之间的距离、所述用户的被检测到的注视的停留时间以及所述话语中的一者或多者来确定在所述电子设备的所述屏幕上显示的要编辑的所述字词。

16.根据权利要求14所述的方法,其中确定对在所述电子设备的所述屏幕上显示的所述字词要做出的所述改变基于所述话语和在所述电子设备的所述屏幕上显示的所述字词的上下文。

17.根据权利要求14所述的方法,还包括:

18.根据权利要求14所述的方法,其中确定在所述电子设备的所述屏幕上显示的要编辑的所述字词是基于所述字词的语言属性。

19.一种电子设备,包括:

20.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储被配置为由电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于以下操作的指令:

21.一种电子设备,包括:

22.一种电子设备,包括:

23.一种存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由电子设备的一个或多个处理器执行时,使得所述电子设备执行根据权利要求1至18中任一项所述的方法。

24.一种电子设备,包括:

25.一种系统,包括用于执行根据权利要求1至18所述的方法中的任一种方法的装置。

26.一种方法,包括:

27.根据权利要求26所述的方法,其中所述第二元素显示在所述第一元素上的所述第一位置处。

28.根据权利要求26至27中任一项所述的方法,其中所述第二元素显示在所述第一元素上与所述第一位置不同的第二位置处。

29.根据权利要求26至28中任一项所述的方法,其中所述第二元素包括引导所述用户将所述用户的所述注视改变到所述第二位置的图形。

30.根据权利要求26至29中任一项所述的方法,还包括:

31.根据权利要求26至30中任一项所述的方法,其中所述第二元素包括链接。

32.根据权利要求31所述的方法,还包括:

33.根据权利要求26至32中任一项所述的方法,还包括:

34.根据权利要求33所述的方法,其中所述第四元素包括对在所述第一位置处显示的字词的一个或多个可能改变。

35.根据权利要求34所述的方法,其中对在所述第一位置处显示的所述字词的所述一个或多个可能改变包括用于替换在所述第一位置处显示的所述字词的一个或多个另选字词。

36.根据权利要求34所述的方法,还包括:

<...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中确定是否进入所述听写模式是利用第一机器学习模型来确定的,并且确定是否进入所述编辑模式是利用与所述第一机器学习模型不同的第二机器学习模型来确定的。

3.根据权利要求1至2中任一项所述的方法,其中确定是否进入所述听写模式以及确定是否进入所述编辑模式是利用第三机器学习模型来确定的。

4.根据权利要求1至3中任一项所述的方法,其中基于所述用户的被检测到的注视来确定是否进入听写模式还包括:

5.根据权利要求4所述的方法,其中基于所述用户的被检测到的注视来确定是否进入听写模式还包括:

6.根据权利要求4所述的方法,其中确定所述用户的被检测到的注视是否指向在所述电子设备的屏幕上显示的所述文本字段还包括:

7.根据权利要求1至6中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

8.根据权利要求7所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

9.根据权利要求1至8中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

10.根据权利要求1至9中任一项所述的方法,其中基于所述用户的被检测到的注视和所述话语来确定是否进入编辑模式还包括:

11.根据权利要求1至10中任一项所述的方法,还包括:

12.根据权利要求11所述的方法,其中用于在所述电子设备的所述屏幕上显示所述话语的所述文本表示的所述第三位置基于所述用户的注视在所述屏幕上的位置来确定。

13.根据权利要求11所述的方法,其中用于在所述电子设备的所述屏幕上显示所述话语的所述文本表示的所述第三位置基于在所述电子设备的所述屏幕上显示的文本的末尾来确定。

14.根据权利要求1至13中任一项所述的方法,还包括:

15.根据权利要求14所述的方法,其中基于所述用户的被检测到的注视、所述用户的被检测到的注视的位置与所述字词之间的距离、所述用户的被检测到的注视的停留时间以及所述话语中的一者或多者来确定在所述电子设备的所述屏幕上显示的要编辑的所述字词。

16.根据权利要求14所述的方法,其中确定对在所述电子设备的所述屏幕上显示的所述字词要做出的所述改变基于所述话语和在所述电子设备的所述屏幕上显示的所述字词的上下文。

17.根据权利要求14所述的方法,还包括:

18.根据权利要求14所述的方法,其中确定在所述电子设备的所述屏幕上显示的要编辑的所述字词是基于所述字词的语言属性。

19.一种电子设备,包括:

20.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储被配置为由电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于以下操作的指令:

21.一种电子设备,包括:

22.一种电子设备,包括:

23.一种存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由电子设备的一个或多个处理器执行时,使得所述电子设备执行根据权利要求1至18中任一项所述的方法。

24.一种电子设备,包括:

25.一种系统,包括用于执行根据权利要求1至18所述的方法中的任一种方法的装置。

26.一种方法,包括:

27.根据权利要求26所述的方法,其中所述第二元素显示在所述第一元素上的所述第一位置处。

28.根据权利要求26至27中任一项所述的方法,其中所述第二元素显示在所述第一元素上与所述第一位置不同的第二位置处。

29.根据权利要求26至28中任一项所述的方法,其中所述第二元素包括引导所述用户将所述用户的所述注视改变到所述第二位置的图形。

30.根据权利要求26至29中任一项所述的方法,还包括:

31.根据权利要求26至30中任一项所述...

【专利技术属性】
技术研发人员:T·S·派克K·M·达亚纳尼K·S·弗里德曼谷岳S·哈拉达V·H·乐D·鲁德琴科G·L·韦恩伯格
申请(专利权)人:苹果公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1