扩展问答集的方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:25835390 阅读:40 留言:0更新日期:2020-10-02 14:16
本申请公开了一种扩展问答集的方法、装置、电子设备和可读存储介质,涉及自然语言处理技术领域。本申请在扩展问答集时所采用的实现方案为:获取问答集,所述问答集中包含原始问题及其对应的答案;根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题;根据原始问题以及扩展问题中的关键词及其对应的权重,构建所述问答集中问题的索引。本申请能够提升问答集的扩展准确性,并提升问答集中所包含信息的丰富性。

【技术实现步骤摘要】
扩展问答集的方法、装置、电子设备和可读存储介质
本申请涉及数据处理
,尤其涉及自然语言处理
中的一种扩展问答集的方法、装置、电子设备和可读存储介质。
技术介绍
在问答系统中,问答系统构建人员会配置包含问题以及答案的问答集。当用户向问答系统输入一个待查询问题时,问答系统根据问答集中问题与用户输入问题之间的匹配程度来确定最相似的问题,进而向用户返回该问题对应的答案。现有技术中通常是由问答系统构建人员来人工对问答集中包含的问题进行扩展,但受限于构建人员的表述习惯,无法获取具有更加多样性表述的问题,导致问答集的扩展效果较差。
技术实现思路
本申请为解决技术问题所采用的技术方案是提供一种扩展问答集的方法,包括:获取问答集,所述问答集中包含原始问题及其对应的答案;根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题;根据原始问题以及扩展问题中的关键词及其对应的权重,构建所述问答集中问题的索引。本申请为解决技术问题所采用的技术方案是提供一种扩展问答集的装置,包括:获取单元,用于获取问答集,所述问答集中包含原始本文档来自技高网...

【技术保护点】
1.一种扩展问答集的方法,包括:/n获取问答集,所述问答集中包含原始问题及其对应的答案;/n根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题;/n根据原始问题以及扩展问题中的关键词及其对应的权重,构建所述问答集中问题的索引。/n

【技术特征摘要】
1.一种扩展问答集的方法,包括:
获取问答集,所述问答集中包含原始问题及其对应的答案;
根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题;
根据原始问题以及扩展问题中的关键词及其对应的权重,构建所述问答集中问题的索引。


2.根据权利要求1所述的方法,还包括:
在根据语义信息对各原始问题进行泛化之前,
获取所述问答集的属性信息;
确定所述属性信息是否满足预设条件,若是,则执行所述根据语义信息对各原始问题进行泛化的操作,否则不执行。


3.根据权利要求1所述的方法,其中,所述根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题包括:
确定各原始问题中的关键词;
根据所述关键词的语义信息对各原始问题进行泛化,将泛化结果作为对应各原始问题的扩展问题。


4.根据权利要求1所述的方法,还包括:
在根据原始问题以及扩展问题中的关键词及其对应的权重,构建所述问答集中问题的索引之前,
对各原始问题与各扩展问题进行比较之后,去除与原始问题相同的扩展问题。


5.一种扩展问答集的装置,包括:
获取单元,用于获取问答集,所述问答集中包含原始问题及其对应的答案;
泛化单元,用于根据语义信息对各原始问题进行泛化,得到对应各原始问题的扩展问题;
构建单元,用于根据原始问题以及扩展问题中的关键词及其对应...

【专利技术属性】
技术研发人员:古桂元焦振宇孙叔琦孙珂李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1