The invention belongs to the technical field of natural language processing, in particular to a Chinese similarity problem generation system and method. The invention provides a new system and method for generating Chinese similar questions. The system and method can locate the corresponding answers in the semantic knowledge base according to similarity, and sort the answers according to the relativity of each sales tag, so as to answer the users, and the same common questions with the attribute of sales tag are in the semantic knowledge base. There may be more than one answer, which can guide \Answer\ more intelligently than a simple question-and-answer. After the question-and-answer, the platform, businesses and customers can benefit from each other.
【技术实现步骤摘要】
一种中文相似问题生成系统与方法
本专利技术属于自然语言处理
,特别涉及一种中文相似问题生成系统与方法。
技术介绍
现有技术提供了一种相似问题生成系统与方法,采用基于规则和统计相结合的方式,可以提高生成的问题问句与原始问题的匹配程度和合理性;但是,在商业中,问答的本质不在于答案的准确性,这种一对一的准确答案未必是消费者所需要的。
技术实现思路
针对上述问题,本专利技术提供一种新的中文相似问题生成系统与方法,该中文相似问题生成系统与方法可以更加智能的回答用户提出的问题,有效保障了平台、商家以及用户之间的利益。本专利技术具体技术方案如下:本专利技术提供一种中文相似问题生成方法,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关 ...
【技术保护点】
1.一种中文相似问题生成方法,其特征在于,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经 ...
【技术特征摘要】
1.一种中文相似问题生成方法,其特征在于,所述生成方法包括:S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。2.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S1的中文语义知识库中关键词与常见问题之间、经过销售标记的常见问题与问题答案之间均可采用多种的映射关系,常见问题与销售标记之间优选采用一一对应的映射关系。3.根据权利要求1所述的中文相似问题生成方法,其特征在于,骤S1中,所述规则包括但不限于根据商家的销售专家知识,当数据量较大时可基于训练生成,所述训练方法包括已知的机器学习算法。4.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4中,匹配出的带有销售标记的常见问题的数量为至少2个。5.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4包括如下步骤:S41:对于带有销售标记属性的常见问题,在中文语义知识库中通过第二算法基于相似度生成若干第一相似问题答案,所述第二算法包括但不限于基于Word2Vec计算常见问题与问题答案之间的相似度;S42:计算带有销售标记属性的常见问题的关联度,基于关联度值对生成的第一相似问题答案进行排序,所述关联度基于训练或规则计算。6.根据权利要求5所述的中文相似问题生成方法,其特征在于,步...
【专利技术属性】
技术研发人员:韩冰,
申请(专利权)人:中通天鸿北京通信科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。