一种主题对话方法和装置制造方法及图纸

技术编号:8190952 阅读:176 留言:0更新日期:2013-01-10 01:51
本申请提供了一种主题对话方法和装置,涉及计算机技术领域。方法包括:解析首次输入的自然语言文本,确认第一语义表达式;针对第一语义表达式匹配分析,得到回话表达式,并确认当前回合的会话主题;根据回话表达式和当前回合的会话主题生成自然语言回话进行返回;解析再次输入的自然语言文本,确认第二语义表达式;针对第二语义表达式进行匹配分析,得到回话表达式,确认当前回合的会话主题;转到下一回合对话直至结束。本申请使用户基于会话主题与对话系统进行交流,使对话回合之间保持连贯性,回话对应的语义与用户的输入查询一致,且结合会话主题反问用户,使对话系统模拟真人聊天,准确连贯地响应用户的自然语言输入查询,与用户积极互动。

【技术实现步骤摘要】

本申请涉及计算机
,特别是涉及ー种主题对话方法和装置
技术介绍
对话系统是ー种能够与人通过自然语言进行交互的电子系统,由人输入自然语言,系统理解后再做出自然语言的回应。比如用户输入文字信息,电子系统中虚拟的机器人针对文字信息与用户进行交互。现有技术中,大致存在两种对话系统一是基于问答对的对话系统基于问答对的对话系统就是指通过预先设定好的问答对来存储的知识的对话系统,在用户提问后,从问答对知识库中选取出最匹配的问题,然 后以该问题的答案做回答。基于问答对的对话系统,对于不同的数据来源有不同的应用,比如,垂直领域中以人工编辑为数据来源的常用于客服类的对话系统;以用户数据为数据来源的常用于娱乐类的聊天系统;以已有问答社区的资源为数据来源的常用于回答公共知识。基于问答对的对话系统大致实现方式如下I、建立知识库通过“人工编辑”、“用户数据”、“问答社区”等知识来源(问答对来源)中的ー个或几个来建立索引库,建立时需要对问题进行语义关键词的提取再做索引,形成知识库;2、用户查询当输入用户查询后,先将该用户查询转换为语义指紋,再从知识库中检索出与其语义相似度大于一定阈值的问题,并获取该问题对应的答案;3、生成答案如果检索出用户查询对应的答案,则输出给用户,否则按预设的流程或答案对用户进行反馈。对于此类对话系统,由于基干“人工编辑”、“用户数据”、“问答社区”等方式获得的问题及答案数量非常有限,对于常见问题可以较好地回答,但对于生僻问题往往效果不佳,同时对用户查询进行的语义解析还不成熟,步骤复合且各项操作都没有较理想的解析精度,只能简单的匹配问题来寻找答案,对话的回合之间相对独立,匹配往往不准确,无法根据用户输入进行相关话题的互动交流。ニ是基于具体服务的对话系统这种对话系统往往基于某些特定应用进行构建,故并不能充分理解用户的意图,只是根据规则或者模型判断出用户需要的应用,提取出有价值的关键词,并直接调用对应的函数,由该特定服务来返回結果,比如天气预报,信息查询等应用。此种对话系统大致实现方式如下I、设定应用类型和应用模块定义需要支持的应用类型,建立相应的功能模块和接ロ,并建立用于需求识别的统计模型和/或规则模型。其中,各应用模块中也以用户查询中的关键词建立索引,并与相应答案进行对应。2、用户查询当用户输入查询后,利用已经设定好的规则模型和/或统计模型判断用户对应的应用类型并提取出相应的关键词,发送给对应的应用模块,应用模块依据关键词匹配相应的答案,然后返回結果。此类对话系统只是基于特定类型的应用,比如天气预报等服务,其知识范围仅限于指定的应用领域,并且仅是简单的基于获得的关键词将对应的答案返回给用户,但当用户与对话系统之间对话回合增多时,对话回合之间则缺乏连贯性,往往造成回话表达的语义与输入查询不一致,即“机器听不懂人话”,同样使用户无法基于相关话题与对话系统进行互动交流。
技术实现思路
本申请所要解决的技术问题是提供ー种主题对话方法和装置,通过对话回合之间的主题准确理解输入的自然语言文本的语义,并结合相应主题进行匹配分析,从而形成回话,使用户与对话系统之间的交流连贯,匹配准确,形成相关话题的互动交流。为了解决上述问题,本申请公开了ー种主题对话方法,包括 步骤110、解析首次输入的自然语言文本中各词所属的词性,确认对应匹配的第一语义表达式;步骤120、针对所述第一语义表达式在结构化知识库中进行匹配分析,得到对应所述第一语义表达式对应的回话表达式,并确认当前回合的会话主题;步骤130、根据当前回合的回话表达式和所述当前回合的会话主题,生成自然语言回话进行返回;步骤140、解析再次输入的自然语言文本中各词所属的词性,结合前一回合的会话信息确认对应匹配的第二语义表达式;步骤150、针对所述第二语义表达式在结构化知识库中进行匹配分析,得到对应所述第二语义表达式对应的回话表达式,结合前一回合的会话信息确认当前回合的会话主题;转到步骤130,直至无自然语言文本输入。优选的,还包括基于当前回合的会话主题从结构化知识库中匹配分析相关的候选会话主題。优选的,所述从结构化知识库中匹配分析相关的候选会话主题包括结合用户的个性化信息和/或预置的系统偏好信息,与当前回合的会话主题在结构化知识库中进行匹配分析,得到相应符合用户个性化信息和/或系统偏好信息的候选会话主題。优选的,还包括根据当前回合的回话表达式和所述候选会话主题,或者根据当前回合的回话表达式、所述候选会话主题和所述当前回合的会话主题,生成自然语言回话返回至用户端。优选的,还包括若当前回合的会话主题不符合预置的系统偏好信息时,根据当前回合的回话表达式和所选择的候选会话主题生成自然语言回话返回至用户端。优选的,还包括将所述当前回合的会话主题对应的关键词输入结构化知识库,检索获得与当前回合的回话表达式相关的候选回话表达式;结合当前回合的回话表达式,及所述当前回合的会话主题对应的关键词,从候选回话表达式中选取对应的关键词作为候选会话主題。优选的,将所述当前回合的会话主题对应的关键词输入结构化知识库,检索获得与当前回合的回话表达式相关的候选回话表达式包括将所述当前回合的会话主题对应的关键词输入结构化知识库,检索包含所述关键词的第三回话表达式;计算所述第三回话表达式与当前回合的回话表达式的相关性,将相关性大于阈值的第三回话表达式作为候选回话表达式。优选的,所述将相关性大于阈值的第三回话表达式作为候选回话表达式进ー步包括 将所述同一知识类别的第三回话表达式进行排序;选择排序靠前的至少ー个第三回话表达式作为候选回话表达式。优选的,还包括从候选回话表达式中,选取与所述当前回合的会话主题对应的关键词在当前回合的回话表达式中的相同词性对应的数据内容作为候选会话主題。优选的,解析所述输入的自然语言文本中各词所属的词性,包括遍历实体词表,将所述自然语言文本转换为既定格式;标记所述转换后的自然语言文本中各实体词所属的词性;所述词性包括实体词、属性词、属性词对应的属性值。优选的,所述结合前一回合的会话信息确认当前回合的会话主题包括结合前一回合的会话信息中的会话主题和/或候选会话主题确认当前回合的会话主題。优选的,还包括通过从全网的各网页中提取的实体词、所述实体词对应的属性词和属性值构建所述结构化知识库。优选的,所述结构化知识库构建时包括针对抓取的同一知识类别的各知识网站,利用相应知识网站的解析模板解析各知识网站的网页内容,获得实体词及与实体词相应的属性词和属性值;针对同一实体词,以实体词、实体词对应的属性词、属性词对应的属性值的数据结构存入结构化知识库。相应的,本申请还公开了ー种主题对话装置,包括第一解析模块,用于解析首次输入的自然语言文本中各词所属的词性,确认对应匹配的第一语义表达式;第一联想模块,用于针对所述第一语义表达式在结构化知识库中进行匹配分析,得到对应所述第一语义表达式对应的回话表达式,并确认当前回合的会话主题;答案生成模块,用于根据当前回合的回话表达式和所述当前回合的会话主题,生成自然语言回话进行返回;第二解析模块,用于解析再次输入的自然语言文本中各词所属的词性,结合前一回合的会话信息确认对应匹配的第二语义表达式;第二联想模块,用于针对所述第二语义表达式在结构化知识库中进行匹配分本文档来自技高网
...

【技术保护点】
一种主题对话方法,其特征在于,包括:步骤110、解析首次输入的自然语言文本中各词所属的词性,确认对应匹配的第一语义表达式;步骤120、针对所述第一语义表达式在结构化知识库中进行匹配分析,得到对应所述第一语义表达式对应的回话表达式,并确认当前回合的会话主题;步骤130、根据当前回合的回话表达式和所述当前回合的会话主题,生成自然语言回话进行返回;步骤140、解析再次输入的自然语言文本中各词所属的词性,结合前一回合的会话信息确认对应匹配的第二语义表达式;步骤150、针对所述第二语义表达式在结构化知识库中进行匹配分析,得到对应所述第二语义表达式对应的回话表达式,结合前一回合的会话信息确认当前回合的会话主题;转到步骤130,直至无自然语言文本输入。

【技术特征摘要】

【专利技术属性】
技术研发人员:张帆
申请(专利权)人:北京搜狗信息服务有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1