【技术实现步骤摘要】
一种抽取对话语料中关键语句的方法、系统、设备及介质
本专利技术涉及自然语言
,特别是涉及一种抽取对话语料中关键语句的方法、设备及介质。
技术介绍
当用户与咨询机器人交互过程中,在缺失关键信息的情况下,咨询机器人将询问用户一些关于关键信息的问题,而这种问题以往通常由机器人训练师人工设定一些关于此类关键信息询问的问题集合,但这种人工设定的抽取效率低下,不能对问题中关键问题语句进行自动抽取;因此本专利技术提出了一种抽取对话语料中关键语句的方法。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种抽取对话语料中关键语句的方法、系统、设备及介质,用于解决现有技术中存在的问题。为实现上述目的及其他相关目的,本专利技术提供一种抽取对话语料中关键语句的方法,包括以下步骤:获取对话语料中的询问语句和陈述语句;根据预先定义的关键要素类型集合识别出所有陈述语句中的关键要素;将所述询问语句拆分为短句,并确定出现所述关键要素时上一询问语句中出现某一固定短句的概率;根 ...
【技术保护点】
1.一种抽取对话语料中关键语句的方法,其特征在于,包括以下步骤:/n获取对话语料中的询问语句和陈述语句;/n根据预先定义的关键要素类型集合识别出所有陈述语句中的关键要素;/n将所述询问语句拆分为短句,并确定出现所述关键要素时上一询问语句中出现某一固定短句的概率;/n根据所述概率确定所述某一固定语句是否为关键语句。/n
【技术特征摘要】
1.一种抽取对话语料中关键语句的方法,其特征在于,包括以下步骤:
获取对话语料中的询问语句和陈述语句;
根据预先定义的关键要素类型集合识别出所有陈述语句中的关键要素;
将所述询问语句拆分为短句,并确定出现所述关键要素时上一询问语句中出现某一固定短句的概率;
根据所述概率确定所述某一固定语句是否为关键语句。
2.根据权利要求1所述的抽取对话语料中关键语句的方法,其特征在于,若上一询问语句中出现某一固定短句的概率大于预设值,则认定所述某一固定短句为询问关键要素的语句,并将所述某一固定短句确定为关键语句。
3.根据权利要求1或2所述的抽取对话语料中关键语句的方法,其特征在于,还包括:
获取对所有固定短句的判断结果;
根据所述判断结果对所有短句进行聚类,将询问同一关键要素的短句聚为一类;
获取聚类结果,删除所述聚类结果中同时询问多个关键要素的短句。
4.根据权利要求3所述的抽取对话语料中关键语句的方法,其特征在于,还包括根据删除同时询问多个关键要素的短句后的聚类结果构建某一关键要素的问题集合。
5.根据权利要求1所述的抽取对话语料中关键语句的方法,其特征在于,通过极大似然估计法估计出现关键要素时上一询问语句中出现某一固定短句的概率。
6.一种...
【专利技术属性】
技术研发人员:彭德光,孙健,
申请(专利权)人:重庆兆光科技股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。