一种中文相似问题生成系统与方法技术方案

技术编号:20566661 阅读:15 留言:0更新日期:2019-03-14 09:27
本发明专利技术属于自然语言处理技术领域,特别涉及一种中文相似问题生成系统与方法。本发明专利技术提供一种新的中文相似问题生成系统与方法,该中文相似问题生成系统与方法可以根据相似度在语义知识库中定位相应的答案,并将答案按照各销售标记的关联度进行排序,从而对用户进行解答,并且,对于同一带有销售标记属性的常见问题在语义知识库中定位到的答案可能不止一个,这样可以更加智能引导“答”,而不是简单的一问一答,在问答后可以使得平台、商家和客户之间均获得利益。

A Chinese Similarity Problem Generation System and Method

The invention belongs to the technical field of natural language processing, in particular to a Chinese similarity problem generation system and method. The invention provides a new system and method for generating Chinese similar questions. The system and method can locate the corresponding answers in the semantic knowledge base according to similarity, and sort the answers according to the relativity of each sales tag, so as to answer the users, and the same common questions with the attribute of sales tag are in the semantic knowledge base. There may be more than one answer, which can guide \Answer\ more intelligently than a simple question-and-answer. After the question-and-answer, the platform, businesses and customers can benefit from each other.

【技术实现步骤摘要】
一种中文相似问题生成系统与方法
本专利技术属于自然语言处理
,特别涉及一种中文相似问题生成系统与方法。
技术介绍
现有技术提供了一种相似问题生成系统与方法,采用基于规则和统计相结合的方式,可以提高生成的问题问句与原始问题的匹配程度和合理性;但是,在商业中,问答的本质不在于答案的准确性,这种一对一的准确答案未必是消费者所需要的。
技术实现思路
针对上述问题,本专利技术提供一种新的中文相似问题生成系统与方法,该中文相似问题生成系统与方法可以更加智能的回答用户提出的问题,有效保障了平台、商家以及用户之间的利益。本专利技术具体技术方案如下:本专利技术提供一种中文相似问题生成方法,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。一种中文相似问题生成系统,所述生成系统包括:中文语义知识库构建模块,用于构建中文语义知识库,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;关键词提取模块,用于若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;常见问题匹配模块,用于将关键词提取模块中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入第一相似问题答案生成模块,如果为不带有销售标记属性的常见问题,则进入第二相似问题答案生成模块并将该常见问题放入待标记销售标记列表;第一相似问题答案生成模块,用于将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;第二相似问题答案生成模块,用于将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;交互模块,用于商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。本专利技术的有益效果如下:本专利技术提供一种新的中文相似问题生成系统与方法,该中文相似问题生成系统与方法可以根据相似度在语义知识库中定位相应的答案,并将答案按照各销售标记的关联度进行排序,从而对用户进行解答,并且,对于同一带有销售标记属性的常见问题在语义知识库中定位到的答案可能不止一个,这样可以更加智能引导“答”,而不是简单的一问一答,在问答后可以使得平台、商家和客户之间均获得利益。附图说明图1为实施例1中文相似问题生成方法的流程图;图2为实施例1步骤S4的流程图;图3为实施例2中文相似问题生成系统的结构框图。具体实施方式下面结合附图和以下实施例对本专利技术作进一步详细说明。附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例1本专利技术实施例1提供一种中文相似问题生成系统与方法,如图1所示,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。本专利技术提供一种新的中文相似问题生成方法,该中文相似问题生成方法可以根据相似度在语义知识库中定位相应的答案,并将答案按照各销售标记的关联度进行排序,从而对用户进行解答,并且,对于同一带有销售标记属性的常见问题在语义知识库中定位到的答案可能不止一个,这样可以更加智能引导“答”,而不是简单的一问一答,在问答后可以使得平台、商家和客户之间均获得利益。步骤S1中,中文语义知识库中关键词与常见问题之间、经过销售标记的常见问题与问题答案之间均可采用多种的映射关系,常见问题与销售标记之间优选采用一一对应的映射关系。常见问题与销售标记之间建立映射关系,也可以是问题答案与销售标记之间建立映射关系,属于本领域相关技术人员的常规选择。步骤S1中,销售标记可以用字母或数字表示,比如分成A、B、C、D共4个类别。所述规则为:根据商家的销售专家知识,比如根据潜在客户的购买阶段,分别为“马上购买”、“有需求”、“有购买欲望”以及“有潜在欲望”递减赋予不同常见问题销售标记,判断的方式包括但不限于将销售类别按人群兴趣点语句、竞品语句、询价语句、品牌语句,上述专家知识不应理解为对本专利技术保护范围的限定,其他能够能够提高销售转化率(ROI)的分类方式均可。如“人群兴趣点语句”标记为A类,“竞品语句”标记为B类,“询价语句”标记为C类,“品牌语句”标记为D类。当数据量较大比如超出10000条时,可基于训练生成,训练的方法包括已知的机器学习算法,比如神经网络算法、马尔可夫算法,基于本专利技术构思选择其他AI算法训练销售标记均在本专利技术保护本文档来自技高网...

【技术保护点】
1.一种中文相似问题生成方法,其特征在于,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。...

【技术特征摘要】
1.一种中文相似问题生成方法,其特征在于,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。2.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S1的中文语义知识库中关键词与常见问题之间、经过销售标记的常见问题与问题答案之间均可采用多种的映射关系,常见问题与销售标记之间优选采用一一对应的映射关系。3.根据权利要求1所述的中文相似问题生成方法,其特征在于,骤S1中,所述规则包括但不限于根据商家的销售专家知识,当数据量较大时可基于训练生成,所述训练方法包括已知的机器学习算法。4.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4中,匹配出的带有销售标记的常见问题的数量为至少2个。5.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4包括如下步骤:S41:对于带有销售标记属性的常见问题,在中文语义知识库中通过第二算法基于相似度生成若干第一相似问题答案,所述第二算法包括但不限于基于Word2Vec计算常见问题与问题答案之间的相似度;S42:计算带有销售标记属性的常见问题的关联度,基于关联度值对生成的第一相似问题答案进行排序,所述关联度基于训练或规则计算。6.根据权利要求5所述的中文相似问题生成方法,其特征在于,步...

【专利技术属性】
技术研发人员:韩冰
申请(专利权)人:中通天鸿北京通信科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1