用于提供语音识别服务的电子装置及其方法制造方法及图纸

技术编号:19429789 阅读:19 留言:0更新日期:2018-11-14 11:29
提供了一种电子装置。电子装置包含麦克风、显示器、存储器以及电连接到该麦克风、显示器和存储器的处理器。处理器配置为执行语音识别功能,以通过麦克风从用户获得第一话语,将基于第一话语产生的文本显示在显示器中,并且将至少一个项目显示在显示器中,该项目对应于文本中被识别为专有名词的部分并且基于第一话语和用户的个性化数据库被确定。

【技术实现步骤摘要】
用于提供语音识别服务的电子装置及其方法相关申请的交叉引用本申请基于并要求于2017年4月28日在韩国知识产权局提交的韩国专利申请第10-2017-0055640号的优先权,其公开内容通过引用整体并入本文。
本公开涉及在电子装置中提供语音识别服务的技术。
技术介绍
为了用户的方便,电子装置使用语音识别技术提供话音输入功能。电子装置可以对用户的话语进行自然语言处理。电子装置通过自然语言处理来掌握用户的意图,并提供与用户意图匹配的结果。此外,电子装置提供基于人工智能的语音秘书服务。用户可以通过话语输入命令,并且电子装置可以进行与话语相对应的命令以充当用户的秘书。此时,电子装置需要进行与用户意图匹配的操作。同时,人工智能系统是实现人级智能的计算机系统。人工智能系统可以自己学习和判断,并且随着人工智能系统被使用,识别率可以改善。人工智能技术(例如,机器学习技术或深度学习技术)可以包含元件技术,该元件技术通过使用自己分类或学习多段输入数据的特性的算法来模拟人脑的功能(例如,识别或决定)。例如,元件技术可以包含识别人的语言或字符的语言理解技术、识别物体(像人)的视觉理解技术、确定信息以逻辑上推断和预测所确定的信息的推断或预测技术、将人类经验信息处理为知识数据的知识表达技术,以及控制车辆的自动驾驶和机器人的运动的操作控制技术中的至少一种。可以理解的是,语言学理解技术是识别和应用/处理人类的语言/字符的技术。语言学理解技术包含自然语言处理、机器翻译、对话系统、查询响应、语音识别/合成等。以上信息仅作为背景信息呈现,以帮助理解本公开。至于以上所述的任何是否可以应用为关于本公开的现有技术,没有做出决定,也没有做出断言。
技术实现思路
在电子装置提供的语音秘书服务中,用户可以通过话语输入控制电子装置的命令。在这种情况下,可以使用词典中没有列出的术语(以下,称为“具有高错误概率的术语”),诸如专有名词、用户创建的创造词等。在语音识别服务中,由于术语以及与该术语相关联的用户自己的发音/音频指纹,可能在语音识别结果中出现错误。在发生错误的情况下,由于进行了错误的控制命令,因此可以提供与用户意图不匹配的结果。本公开的各方面至少解决上述问题和/或缺点并提供至少下述优点。因此,本公开的一方面在于提供一种电子装置,其在语音识别中解决由于具有高错误概率术语、与该术语相关联的用户发音等引起的故障。根据本公开的一个方面,提供了一种电子装置。电子装置包含麦克风、显示器、存储器以及电连接到该麦克风、显示器和存储器的处理器。处理器配置为执行语音识别功能以通过麦克风从用户获得第一话语,将基于第一话语产生的文本显示在显示器中,并且将至少一个项目(item)显示在显示器中,该项目对应于文本中被识别为专有名词的部分并且基于第一话语和用户的个性化数据库被确定。根据本公开的另一方面,提供了一种由电子装置进行的方法。该方法包含执行语音识别功能以通过麦克风从用户获得第一话语,将基于第一话语产生的文本显示在显示器中,并且将至少一个项目显示在显示器中,该项目对应于所产生的文本中被识别为专有名词的文本的部分并且基于第一话语和用户的个性化数据库被确定。根据本公开的各种实施例,电子装置在进行语音识别的操作中可以识别具有高错误概率的术语,并且可以进行包含该术语的命令。根据本公开的各种实施例,电子装置可以关于具有高错误概率的术语训练具体用户的具体发音和音频指纹。而且,可以提供通过本公开直接或间接理解的各种效果。根据以下结合附图公开了本公开的各种实施例的详细描述,本公开的其他方面、优点和显着特征对于本领域技术人员将变得显而易见。附图说明根据以下结合附图的描述,本公开的某些实施例的以上和其他方面、特征和优点将变得更加明显,其中:图1图示了根据本公开的实施例的进行语音输入的环境;图2是图示根据本公开的实施例的电子装置的配置的框图;图3图示了根据本公开的实施例的提供语音秘书服务的过程;图4图示了根据本公开的实施例的提供语音秘书服务的过程;图5图示了根据本公开的实施例的当提供语音秘书服务时修订专有名词的过程;图6A和6B图示了根据本公开的实施例的用户界面;图7图示了根据本公开的实施例的当提供语音秘书服务时训练专有名词的过程;图8A、8B、9A和9B图示了根据本公开的实施例的用于关于专有名词的训练的引导屏幕;图10图示了根据本公开的各种实施例的网络环境中的电子装置;图11是图示根据本公开的各种实施例的集成智能系统的视图;图12是图示根据本公开的实施例的集成智能系统的用户终端的框图;以及图13是图示根据本公开的实施例的执行用户终端的智能应用的视图。在整个附图中,应该注意的是,同样的附图标记用于描绘相同或类似的元件、特征和结构。具体实施方式提供以下参考附图的描述以帮助全面理解由权利要求及其等同物限定的本公开的各种实施例。它包括各种具体细节以帮助理解,但这些仅被视为示例性的。因此,本领域的普通技术人员将认识到,在不脱离本公开的范围和精神的情况下,可以对本文所描述的各种实施例进行各种改变和修改。另外,为了清楚和简洁,可以省略对公知功能和结构的描述。在以下的描述和权利要求中使用的术语和词语不限于书面含义,而是仅被专利技术人用来使得能够清楚和一致地理解本公开。因此,本领域技术人员应该清楚,提供本公开的各种实施例的以下描述仅用于说明的目的,而不是为了限制由所附权利要求及其等同物限定的本公开的目的。应该理解,除非上下文另有明确地指示,否则单数形式“一”、“一个”和“该”包含复数个指示物。因此,例如,提及“组件表面”包含提及这样的表面的一个或多个。图1图示了根据本公开的实施例的进行语音输入的环境。参照图1,电子装置100可以从用户50获得话语。电子装置100可以执行语音识别功能并且可以获得基于该话语产生的文本。所产生的文本可对应于用户50想要的与电子装置100相关联的控制命令。在本说明书中,语音识别功能可以意指将从用户50获得的话语转换成与用户50的意图相匹配的文本的功能。电子装置100可以通过提供语音识别功能的外部装置30(例如,外部服务器)执行语音识别功能。例如,外部装置30可以通过网络连接到电子装置100。替代地,电子装置100可以通过电子装置100中的自动语音识别(ASR)模块来执行语音识别功能。在前一种情况下,电子装置100可以将获得的话语发送给提供语音识别功能的外部装置30,并且可以基于话语接收所产生的文本。在后一种情况下,电子装置100可以通过使用ASR模块来产生从用户50的话语转换的文本。在进行与所产生的文本相对应的命令之前,电子装置100可以在电子装置100的显示器中显示所产生的文本,以确定所产生的文本是否与用户50的意图相匹配。电子装置100可以识别产生的文本中具有高错误概率的术语。电子装置100可以高亮显示包含识别的术语的具体部分(例如,高亮标记等)。用户50可以验证具有高错误概率的被显示的术语;在术语被错误识别的情况下,用户50可以将该术语修订为正确的(预期的)术语。具有高错误概率的术语可以包含专有名词、创造词和新造词,这些词在词典中未列出。当提供语音识别功能时,该术语可以不包含在通用数据库中。因此,该术语可能被错误地识别。以下,描述了具有高错误概率的术语中的专有名词的示例。然而本文档来自技高网
...

【技术保护点】
1.一种电子装置,包括:麦克风;显示器;存储器;以及处理器,其电连接到所述麦克风、所述显示器和所述存储器,其中所述处理器配置为:执行语音识别功能,通过所述麦克风从用户获得第一话语,将基于所述第一话语产生的文本显示在所述显示器中,并且将至少一个项目显示在所述显示器中,所述项目对应于所述文本中被识别为专有名词的部分并且基于所述第一话语和所述用户的个性化数据库被确定。

【技术特征摘要】
2017.04.28 KR 10-2017-00556401.一种电子装置,包括:麦克风;显示器;存储器;以及处理器,其电连接到所述麦克风、所述显示器和所述存储器,其中所述处理器配置为:执行语音识别功能,通过所述麦克风从用户获得第一话语,将基于所述第一话语产生的文本显示在所述显示器中,并且将至少一个项目显示在所述显示器中,所述项目对应于所述文本中被识别为专有名词的部分并且基于所述第一话语和所述用户的个性化数据库被确定。2.如权利要求1所述的电子装置,其中所述处理器还配置为:通过使用至少一个应用来进行与所述产生的文本相对应的命令,并且当用于提供所述命令的执行错误的通知的第一事件发生时,将所述至少一个项目显示在显示器中,所述项目基于所述第一话语和与所述至少一个应用相关联的所述个性化数据库被确定。3.如权利要求2所述的电子装置,其中所述至少一个应用包含呼叫应用,其中所述个性化数据库包含联系人列表和呼叫记录,并且其中所述处理器还配置为,基于所述第一话语、所述联系人列表和所述呼叫记录将所述至少一个项目显示在所述显示器中。4.如权利要求2所述的电子装置,其中所述至少一个应用包含网络浏览器,其中所述个性化数据库包含在所述网络浏览器中输入的搜索记录,并且其中所述处理器还配置为,基于所述第一话语和所述搜索记录将所述至少一个项目显示在所述显示器中。5.如权利要求2所述的电子装置,其中所述至少一个应用包含电子邮件应用,其中所述个性化数据库包含电子邮件的收件人信息和发件人信息,并且其中所述处理器还配置为,基于所述第一话语、所述收件人信息和所述发件人信息将所述至少一个项目显示在所述显示器中。6.如权利要求2所述的电子装置,其中所述至少一个应用包含社交网络应用,其中所述个性化数据库包含在所述社交网络应用中输入的标签和位置标签,并且其中所述处理器还配置为,基于所述第一话语、所述标签和所述位置标签将所述至少一个项目显示在所述显示器中。7.如权利要求2所述的电子装置,其中所述至少一个应用包含地图应用,其中所述个性化数据库包含在所述地图应用中输入的地名,并且其中所述处理器配置为,基于所述第...

【专利技术属性】
技术研发人员:吴荣一李垠京崔正贤
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1