A system and method are provided for improving a language model for speech recognition by applying a knowledge source used by a language model to a session context. Knowledge sources, such as knowledge graphs, are used to capture and model the dynamic session context based on user interaction information from the mapping to the source of knowledge, such as session logs. According to the sequence of user interaction, can determine intent to sequence the higher level, and used to form expectations similar intentions but with different parameters of the model, the parameters including the parameters do not necessarily appear in the history of the use of. In this way, the conversational context model can be used to determine the interaction from the user may the next round \or in a given previous round or some rounds of the case\. Then the next language model and may turn to the corresponding interpolation, and provides its users receive recognition from to improve the accuracy of the next round.
【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
支持语音的人机对话系统(如与娱乐系统或个人设备的语音交互)依赖于用户语音的准确识别。例如,有效的语音搜索应用必须准确地识别用户提交的查询或其它交互,以使得返回给用户的信息与用户提交查询或动作的意图相关。在与这些系统中的一个系统的一系列交互或“轮次”中,用户可能提交多个查询。通常,这些查询的内容在单词级别或词汇上从一个轮次改变到下一个,但它在同一个会话中通常在语义或意图级别上共享一些关联性。例如,用户可以询问电影,然后想知道正在播放该电影的剧院的附近位置。这种情况在结构化域(如娱乐系统或个人助理应用)中特别常见,在其中,为了完成任务,用户可以指定若干条信息。(例如,对于进行航班预订的任务来说,这可以包括指定出发和到达地点、航班日期、优选时间、优选航空公司等。)但是即使当用户的目标意图从一个轮次改变到下一个时,在连续查询之间仍然可能存在一些关联性或相关性;例如,在购买机票后预订租车或查找酒店。通过将该用户会话上下文信息并入由用于语音识别的对话系统使用的语言模型中,可以通过提供更好的目标和预测建模来提高系统的准确性。然而,用有限的过去数据(例如,直到当前时间的特定会话中的过去查询)在语义级捕捉该信息是具有挑战性的。此外,对会话上下文进行建模的现有努力仅考虑当前会话中的过去查询,并假设整个会话仅针对一个特定主题或意图。另外,这些方法不对用户在每个会话中采取的顺序动作进行建模。
技术实现思路
提供本
技术实现思路
以便以简化的形式对下面在具体实施方式中进一步描述的设计构思的选择进行介绍。本
技术实现思路
并不旨在确定要求保护的专利技术主题的关键特征或重要特征,也不旨在用于 ...
【技术保护点】
具有体现在其上的计算机可执行指令的一个或多个计算机可读介质,当由具有处理器和存储器的计算系统执行时,所述计算机可执行指令使所述计算系统执行用于基于用户历史来提供适用于会话上下文的语言模型的方法,所述方法包括:接收包括用户交互事件的一个或多个序列的使用历史信息;针对所述一个或多个序列中的每个事件,确定与所述事件相对应的可能的用户意图;基于针对每个事件所确定的所述可能的用户意图,确定意图转移概率的集合;以及使用所述意图转移概率的集合来生成针对所述用户进行个性化的语言模型。
【技术特征摘要】
【国外来华专利技术】2014.06.18 US 14/308,1741.具有体现在其上的计算机可执行指令的一个或多个计算机可读介质,当由具有处理器和存储器的计算系统执行时,所述计算机可执行指令使所述计算系统执行用于基于用户历史来提供适用于会话上下文的语言模型的方法,所述方法包括:接收包括用户交互事件的一个或多个序列的使用历史信息;针对所述一个或多个序列中的每个事件,确定与所述事件相对应的可能的用户意图;基于针对每个事件所确定的所述可能的用户意图,确定意图转移概率的集合;以及使用所述意图转移概率的集合来生成针对所述用户进行个性化的语言模型。2.根据权利要求1所述的一个或多个计算机可读介质,其中,所述使用历史信息包括一个或多个用户会话日志。3.根据权利要求1所述的一个或多个计算机可读介质,其中,所述转移概率的集合中的每个转移概率表示从与所述一个或多个序列中的第一序列中的第一事件相对应的第一意图向与所述一个或多个序列中的所述第一序列中的第二事件相对应的第二意图转移的可能性。4.根据权利要求1所述的一个或多个计算机可读介质,其中,所提供的语言模型是至少部分基于所述意图转移概率的集合中的意图转移概率的子集来进行内插的。5.一种用于基于用户历史信息来提供会话上下文模型的方法,所述方法包括:接收包括关于用户交互的一个或多个序列的信息的使用历史信息,每个序列至少包括第一交互和第二交互;针对所述一个或多个序列中的每个第一交互,确定与所述第一交互相对应的知识源的第一轮次部分;针对所述一个或多个序列中的每个第二交互,确定与所述第二交互相对应的知识源...
【专利技术属性】
技术研发人员:M·阿克巴恰克,D·Z·哈卡尼图尔,G·图尔,L·P·赫克,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。