一种获取会话回复内容的方法技术

技术编号:15691045 阅读:95 留言:0更新日期:2017-06-24 03:56
本发明专利技术提供的获取会话回复内容的方法,通过采集会话语料,获取会话语料中的会话对,根据预设的场景标签,采集获得会话对与场景标签对应的场景标签值,将会话对、场景标签以及与场景标签对应的场景标签值进行匹配组合,从而生成会话语料库,在会话语料库中匹配与通讯对方发送的当前会话内容匹配的回复内容,并将回复内容作为与当前会话内容对应的会话回复内容,解决了根据现有的会话语料库匹配获得的会话回复内容精度不高的技术问题。且通过基于会话内容自动建立会话语料库,大大减少了人工建立会话语料库的工作量,智能化程度高。

Method for obtaining reply content of conversation

The invention provides a method for session reply content, through the acquisition of conversational data, access to the session data in the session, according to the preset scene label, collected a session on the scene and the scene corresponding tag tag value, will be a session on the scene and the scene tag and label the corresponding tag value of scene matching combination, thus to generate conversational corpora, matching in conversational corpora in communication with each other to send return the contents of the current session, the content, and will return the contents as corresponding to the current session content of the session reply content, solved according to the existing database, the conversational session reply technology content accuracy. And through the establishment of discourse database automatically based on conversational content, it greatly reduces the workload of artificially building discourse database, and has high intelligence.

【技术实现步骤摘要】
一种获取会话回复内容的方法
本专利技术涉及通信
,具体涉及一种获取会话回复内容的方法。
技术介绍
目前,智能会话系统中的会话回复内容,主要是通过匹配会话语料库获取。根据现有的会话语料库匹配获得的回复内容精度不高,特别是针对复杂或非标准结构的会话句,难以从会话语料库中匹配获得精准的会话回复内容。针对该问题,本专利技术提出了一种获取会话回复内容的方法。
技术实现思路
本专利技术提供了一种获取会话回复内容的方法,以解决根据现有的会话语料库匹配获得的会话回复内容精度不高的技术问题。本专利技术提供的获取会话回复内容的方法,包括:采集会话语料;获取会话语料中的会话对;根据预设的场景标签,采集获得会话对与场景标签对应的场景标签值;将会话对、场景标签以及与场景标签对应的场景标签值进行匹配组合,从而生成会话语料库;在会话语料库中匹配与通讯对方发送的当前会话内容匹配的回复内容,并将回复内容作为与当前会话内容对应的会话回复内容。进一步地,获取会话语料中的会话对包括:根据会话语料中会话句的语义,确定会话语料中的发起句和回复句;根据预设的类型判断规则,确定发起句和回复句的类型;根据发起句以及发起句与下一条发本文档来自技高网...
一种获取会话回复内容的方法

【技术保护点】
一种获取会话回复内容的方法,其特征在于,包括:采集会话语料;获取所述会话语料中的会话对;根据预设的场景标签,采集获得所述会话对与所述场景标签对应的场景标签值;将所述会话对、所述场景标签以及与所述场景标签对应的场景标签值进行匹配组合,从而生成会话语料库;在所述会话语料库中匹配与通讯对方发送的当前会话内容匹配的回复内容,并将所述回复内容作为与所述当前会话内容对应的会话回复内容。

【技术特征摘要】
1.一种获取会话回复内容的方法,其特征在于,包括:采集会话语料;获取所述会话语料中的会话对;根据预设的场景标签,采集获得所述会话对与所述场景标签对应的场景标签值;将所述会话对、所述场景标签以及与所述场景标签对应的场景标签值进行匹配组合,从而生成会话语料库;在所述会话语料库中匹配与通讯对方发送的当前会话内容匹配的回复内容,并将所述回复内容作为与所述当前会话内容对应的会话回复内容。2.根据权利要求1所述的获取会话回复内容的方法,其特征在于,获取所述会话语料中的会话对包括:根据所述会话语料中会话句的语义,确定所述会话语料中的发起句和回复句;根据预设的类型判断规则,确定所述发起句和所述回复句的类型;根据所述发起句以及所述发起句与下一条发起句之间的回复句提取基础会话对;根据所述基础会话对、所述基础会话对中发起句和回复句的类型,提取至少一个会话对。3.根据权利要求2所述的获取会话回复内容的方法,其特征在于,根据所述会话语料中会话句的语义,确定所述会话语料中的发起句和回复句包括:判断所述会话语料中的会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将所述会话句确定为发起句;若有,则判断所述会话句是否与所述通讯对方发送的上文无语义关联,若是,则将所述会话句确定为发起句,否则将所述会话句确定为回复句。4.根据权利要求3所述的获取会话回复内容的方法,其特征在于,根据预设的类型判断规则,确定所述发起句的类型包括:判断所述发起句是否为具有完整独立语义的语句,若是,则判断所述发起句是否由多个具有完整独立语义的单句组成,若是,则将所述发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断所述发起句是否包含具有完整独立语义的单句,若包含,则将所述发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;搜索非标准单句发起句类型的所述发起句是否有自己的上文和下文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的所述发起句是否可与所述自己的上文和下文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;搜索非标准复句发起句类型的所述发起句是否有自己的上文和下文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准复句发起句类型的所述发起句是否可与所述自己的上文和下文连续会话句合并成具有完整独立语义的语句,若能,则将非标准复句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;判断单句、复句、非标准单句、非标准复句以及非标准句群类型的所述发起句是否有自己的上文和下文连续会话句,若有,则进一步判断所述发起句是否可与自己的上文和下文连续会话句合并成语义关联的句群,若是,则将所述发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。5.根据权利要求3所述的获取会话回复内容的方法,其特征在于,根据预设的类型判断规则,确定所述回复句的类型包括:判断所述回复句是否为具有完整独立语义的语句,若是,则判断所述回复句是否由多个具有完整独立语义的单句组成,若是,则将所述回复句的类型确定为复句回复句类型,否则为单句回复句类型;若否,则判断所述回复句是否包含具有完整独立语义的单句,若包含,则将所述回复句的类型确定为非标准复句回复句类型,若不包含,则为非标准单句回复句类型;搜索非标准...

【专利技术属性】
技术研发人员:陈包容
申请(专利权)人:长沙军鸽软件有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1