【技术实现步骤摘要】
基于短会的关联信息提方法、装置、电子设备及存储介质
本专利技术涉及客服机器人领域,尤其是涉及一种基于短会的关联信息提方法、装置、电子设备及存储介质。
技术介绍
特定领域内的客服机器人使用场景中,例如购物、理财、政务等,客户会话内容通常具有简短、相似性高、干扰信息多、有一定的节奏性等特点。客服机器人对用户会话请求内容的理解和预测能力决定了客服机器人的智能程度,为此如何提高客服机器人的会话理解意图和预测能力,为客户提供精准的个性化推荐是本领域亟待解决的技术问题。
技术实现思路
为了改善相关技术中的不足,本专利技术第一方面致力于提供一种基于短会话的关联信息提取方法,包括:获取会话请求内容;构建相似会话请求内容集,比较会话请求内容,将相似度满足第一预设条件的会话请求内容配置到所述相似会话请求内容集,并为该相似会话请求内容集设置一主旨句;构建相似会话请求内容集列表,根据会话请求内容在会话中出现的先后顺序构建相似会话请求内容列表;确定关联信息,统计后一会话请求内容在前一会话请求内容后出 ...
【技术保护点】
1.一种基于短会话的关联信息提取方法,其特征在于:/n获取会话请求内容;/n构建相似会话请求内容集,比较所述会话请求内容,将相似度满足第一预设条件的所述会话请求内容配置到所述相似会话请求内容集,并为该相似会话请求内容集设置一主旨句;/n构建相似会话请求内容集列表,根据所述会话请求内容在会话中出现的先后顺序构建所述相似会话请求内容集列表;/n确定关联信息,统计后一会话请求内容在前一会话请求内容后出现的频次,根据所述频次确定所述后一会话请求内容和所述前一会话请求内容的关联度;/n提取关联信息,将所述关联度满足第二预设条件的后一会话请求内容作为前一会话请求内容的关联信息。/n
【技术特征摘要】
1.一种基于短会话的关联信息提取方法,其特征在于:
获取会话请求内容;
构建相似会话请求内容集,比较所述会话请求内容,将相似度满足第一预设条件的所述会话请求内容配置到所述相似会话请求内容集,并为该相似会话请求内容集设置一主旨句;
构建相似会话请求内容集列表,根据所述会话请求内容在会话中出现的先后顺序构建所述相似会话请求内容集列表;
确定关联信息,统计后一会话请求内容在前一会话请求内容后出现的频次,根据所述频次确定所述后一会话请求内容和所述前一会话请求内容的关联度;
提取关联信息,将所述关联度满足第二预设条件的后一会话请求内容作为前一会话请求内容的关联信息。
2.根据权利要求1所述的基于短会话的关联信息提取方法,其特征在于:构建相似会话请求内容集包括,
比较属于同一会话ID的所述会话请求内容,构建所述同一会话ID的相似会话请求内容集。
3.根据权利要求2所述的基于短会话的关联信息提取方法,其特征在于:构建相似会话请求内容集列表包括,
将不同会话ID的所述相似会话请求内容集中相似度满足第三预设条件的所述会话请求内容合并形成相似会话请求内容全集,并为该相似会话请求内容全集设置一全集主旨句。
4.根据权利要求1所述基于短会话的关联信息提取方法,其特征在于:所述前一会话请求内容和所述后一会话请求内容均具有业务含义。
5.根据权利要求1所述基于短会话的关联信息提取方法,其特征在于:在获取所述会话请求内容之前,还包括对所述会话请求内容预处理。
6.根据权利要求1所述的基于短会的关联信息提取方法,其特征在于,所述相似度为综合相似度,计算方式为:
Q=C·α+W·β+S·γ
其中Q为综合相似度得分;
C为基于内容计算的相似度,α为基于内容计算的相似度对应的权重值,α在[0.7-0.9]取值;
W为基于关键词命中计算的相似度,β为基于关键词命中计算的相似度对应的权重值,β在[0.05-0.15]取值;
S:基于词顺序计算的相似度...
【专利技术属性】
技术研发人员:杨雷,李昱,王全礼,唐汇,鹿江锋,
申请(专利权)人:中国建设银行股份有限公司,建信金融科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。