【技术实现步骤摘要】
基于在线语言翻译的人机对练系统
本专利技术涉及人工智能
,更具体地,涉及基于在线语言翻译的人机对练系统。
技术介绍
现在的人机对话问答系统中,当用户输入问题后,识别用户所要询问的意图是整个问答系统中核心的部分,意图识别正确但准确率太低,会造成后期给用户返回答案时,答案太多而无法选择最优答案的问题;意图识别错误会造成无法理解用户的意思,从而会给用户提供其不想要的答案或者直接无法给出答案。现有的问答系统,主要是通过计算机的算法逻辑来实现,基本过程包括问题分析、信息检索和答案抽取三个过程。在这三个过程中,任何一个环节出现纰漏,用户将无法得到正确的结果。更为重要的是,由于这种问答系统的可调性较差,无法利用用户问题,让自己变得更加智能,所以当用户再一次输入同样的问提,基于同样的逻辑,用户还是无法获取正确结果,除非对这套问答系统的算法逻辑进行修改。由此可见,问答系统的可调性已成为影响问答系统准确性和及时性的关键问题。现有意图识别的方法都是基于人工标注大量的语料来进行训练和预测,由于需要大量的人工标注,会存在很多的不可控因素,比如每个标注人员对于语料理解的不同会导致不同的 ...
【技术保护点】
1.基于在线语言翻译的人机对练系统,包括:翻译模块,用于将语音信息进行文本化处理;分类模块,用于利用用于训练的文本形式的对话数据O按照语境进行分类;训练模块,用于检测好感度信息Ginfo、类似语句重复度信息Iinfo、对话时长信息Linfo,对数据O进行训练。
【技术特征摘要】
1.基于在线语言翻译的人机对练系统,包括:翻译模块,用于将语音信息进行文本化处理;分类模块,用于利用用于训练的文本形式的对话数据O按照语境进行分类;训练模块,用于检测好感度信息Ginfo、类似语句重复度信息Iinfo、对话时长信息Linfo,对数据O进行训练。2.根据权利要求1所述的方法,其特征在于,所述语境包括售前、售中和售后三种语境,这三种语境分别具有彼此不同的、预先确定的权值。3.根据权利要求2所述的方法,其特征在于,所述好感度信息Ginfo包括使用礼貌用语的次数信息Ginfo_wordnum、词语内容信息Ginfo_wordcontent以及使用表情的次数信息Ginfo_facenum和表情对应的ASCII码Ginfo_facecontent。4.根据权利要求3所述的方法,其特征在于,所述类似语句重复度信息Iinfo包括重复语句的次数信息Iinfo_num以及词语内容信息Iinfo_content。5.根据权利要求4所述的方法,其特征在于,所述对数据O进行训练包括:对用于训练的文本形式的对话数据按照语义拆分成不同词语;对于第g个语句和第g+1个语句,对其中不同语义对应的词语进行相似度卷积,并将卷积值最大的定义为最大词语,将卷积值最小的定义为最小词语,g为1,2,…,Num1,其中Num1表示用于训练的文本形式...
【专利技术属性】
技术研发人员:向业锋,毛力,谭毅,刘鹏,
申请(专利权)人:四川淘金你我信息技术有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。