基于人工智能的对话方法、装置及计算机可读介质制造方法及图纸

技术编号：18237787 阅读：52 留言：0更新日期：2018-06-17 01:02

本发明专利技术提供一种基于人工智能的对话方法、装置及计算机可读介质。其方法包括：接收用户的输入语句以及输入语句对应的上文语句；根据输入语句，从预设的语料库中获取对应的多个候选对话语句；根据输入语句、上文语句、各候选对话语句以及预先训练的分值预估模型，为各候选对话语句打分；根据多个候选对话语句的打分，从多个候选对话语句中获取目标对话语句，实现对话。本发明专利技术的技术方案，根据输入语句以及输入语句的上文语句，获取目标对话语句，充分参考了语境，从而能够有效地提高获取的目标对话语句的准确性。且本发明专利技术的技术方案，通过采用模型的方式获取目标对话语句，能够有效地提高对话的智能性以及对话效率。 1

Artificial intelligence based dialogue method, device and computer-readable medium

The invention provides a dialogue method, device and computer readable medium based on artificial intelligence. The methods include receiving the input statement of the user and the sentence corresponding to the input statement; obtaining the corresponding multiple candidate dialogues from the presupposed corpus according to the input statement, and according to the input statement, the above statement, the candidate dialogues and the pre trained evaluation model for the candidate dialogues. Scoring; according to the scoring of multiple candidate dialogue statements, the target dialogue statement is obtained from multiple candidate dialogue statements to achieve dialogue. The technical scheme of the invention can obtain the target dialogue sentence according to the input statement and the sentence of the input statement, and fully refer to the context, thus effectively improving the accuracy of the acquired target dialogue sentence. Moreover, the technical proposal of the invention can obtain the target dialogue statement by adopting the model, and can effectively enhance the intelligence and efficiency of dialogue. One

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的对话方法、装置及计算机可读介质
本专利技术涉及计算机应用
，尤其涉及一种基于人工智能的对话方法、装置及计算机可读介质。
技术介绍
人工智能(ArtificialIntelligence；AI)，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。智能对话系统的应用中，多采用的基于检索方式的对话系统，该基于检索方式的对话系统的框架是离线人工整理对话的数据对pair<utterance(用户话语)，response(用户回复)>，建立对话数据库，该对话数据库中可以包括无数对的对话。这样在用户输入一个新的话语utterance的时候，通过匹配库里相似的话语，使用相似话语的回复response作为用户的回复，来呈现给用户。但是在实际应用中，不同的话语是有具体的语境的，在不同的语境里，相同的一句话可能具有完全不同的含义表达，因此现有技术中，仅根据预先建立的对话数据库来获取用户的回复语句的准确性较差。
技术实现思路
本专利技术提供了一种基于人工智能的对话方法、装置及计算机可读介质，用于提高获取用户的回复语句的准确性。本专利技术提供一种基于人工智能的对话方法，所述方法包括：接收用户的输入语句以及所述输入语句对应的上文语句；根据所述输入语句，从预设的语料库中获取对应的多个候选对话语句；根据所述输入语句、...
基于人工智能的对话方法、装置及计算机可读介质

【技术保护点】
1.一种基于人工智能的对话方法，其特征在于，所述方法包括：

【技术特征摘要】
1.一种基于人工智能的对话方法，其特征在于，所述方法包括：接收用户的输入语句以及所述输入语句对应的上文语句；根据所述输入语句，从预设的语料库中获取对应的多个候选对话语句；根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型，为各所述候选对话语句打分；根据所述多个候选对话语句的打分，从所述多个候选对话语句中获取目标对话语句，实现对话。2.根据权利要求1所述的方法，其特征在于，根据所述输入语句，从预设的语料库中获取对应的多个候选对话语句，具体包括：根据所述输入语句，并结合所述上文语句，从所述语料库中获取同时与所述输入语句和所述上文语句对应的多个候选对话语句。3.根据权利要求1所述的方法，其特征在于，根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型，为各所述候选对话语句打分，具体包括：对于各所述候选对话语句，将所述输入语句、所述上文语句以及对应的所述候选对话语句输入至所述分值预估模型，获取对应的所述候选对话语句的打分。4.根据权利要求3所述的方法，其特征在于，根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型，为各所述候选对话语句打分之前，所述方法还包括：采集数组训练数据，各组所述训练数据中包括训练输入语句、训练上文语句以及多个训练对话语句，所述多个训练对话语句中包括正例对话语句和负例对话语句；根据各组所述训练数据，训练所述分值预估模型，直到所述分值预估模型对应的目标函数收敛，确定所述分值预估模型的参数，从而确定所述分值预估模型。5.根据权利要求1所述的方法，其特征在于，根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型，为各所述候选对话语句打分，具体包括：根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的字粒度的表达模型、词粒度的表达模型以及短语粒度的表达模型，分别获取所述输入语句、所述上文语句、以及各所述候选对话语句的字粒度表达、词粒度表达以及短语粒度表达；根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达，获取所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达；根据所述输入语句和各所述候选对话语句的字粒度表达、词粒度表达以及短语粒度表达，获取所述输入语句与各所述候选对话语句之间的正向匹配表达以及反向匹配表达；根据所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达、所述输入语句与各所述候选对话语句之间的正向匹配表达以及反向匹配表达以及预先训练的打分模型，获取各所述候选对话语句的打分。6.根据权利要求5所述的方法，其特征在于，根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达，获取所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达，具体包括：根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达，分别获取所述输入语句与所述上文语句之间的字粒度的正向相似度表达以及反向相似度表达、词粒度的正向相似度表达以及反向相似度表达、以及短语粒度的正向相似度表达以及反向相似度表达；根据所述输入语句与所述上文语句之间的所述字粒度的正向相似度表达、所述词粒度的正向相似度表达以及所述短语粒度的正向相似度表达，获取所述输入语句与所述上文语句之间的所述正向匹配表达；根据所述输入语句与所述上文语句之间的所述字粒度的反向相似度表达、所述词粒度的反向相似度表达以及所述短语粒度的反向相似度表达，获取所述输入语句与所述上文语句之间的所述反向匹配表达。7.根据权利要求1-6任一所述的方法，其特征在于，根据所述输入语句，从预设的语料库中获取对应的多个候选对话语句之前，所述方法还包括：获取人工方式采集的多组三元语料组，构成所述语料库；各所述三元语料组中包括预设上文语句、预设输入语句以及预设对话语句。8.根据权利要求1-6任一所述的方法，其特征在于，根据所述输入语句，从预设的语料库中获取对应的多个候选对话语句之前，所述方法还包括：采集数组候选三元语料组；采用预先训练的上下文相关模型，从所述数组候选三元语料组中获取符合上下文相关性的多组三元语料组，构成所述语料库；进一步地，采用预先训练的上下文相关模型，从所述数组候选三元语料组中获取符合上下文相关性的多组三元语料组之前，所述方法还包括：获取人工采集的多组三元训练语料组，各所述三元训练语料组中包括人工标注的训练上文语句、训...

【专利技术属性】
技术研发人员：徐新超，刘占一，吴文权，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人