医疗领域问答对的生成方法、装置、计算机设备和介质制造方法及图纸

技术编号:26597710 阅读:31 留言:0更新日期:2020-12-04 21:19
本申请设计人工智能技术领域,特别是涉及一种医疗领域问答对的生成方法、装置、计算机设备和介质,包括:基于获取问诊记录数据中的各对象标识,对问诊记录数据中的各问答句分别进行意图识别,得到对应的意图标识序列;根据多个问诊记录数据对应的意图标识序列,确定意图标识序列中各问句的问句意图标识所对应的多个初始答句的答句识别标识;从多个初始答句的答句识别标识中确定对应问句的目标答句意图标识,并基于各问句意图标识以及对应的目标答句意图标识,生成各目标问答对。采用本方法能够提升线上问答系统的问答对的覆盖率以及准确性。此外,本发明专利技术还涉及区块链技术,问诊记录数据、意图标识序列以及目标问答对均可以存储于区块链中。

【技术实现步骤摘要】
医疗领域问答对的生成方法、装置、计算机设备和介质
本申请涉及人工智能
,特别是涉及一种医疗领域问答对的生成方法、装置、计算机设备和介质。
技术介绍
随着互联网的飞速发展,在健康相关的医疗领域,出现了许多在线疾病问答网站,通过线上问答系统可以为患者初期提供有建设性的疾病诊断建议。对于线上问诊系统而言,海量优质的问答对可以提升线上问答系统的覆盖率与准确率,如何提升线上问答系统的问答对的覆盖率以及准确性成为亟待解决的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提升线上问答系统的问答对的覆盖率以及准确性的医疗领域问答对的生成方法、装置、设备和介质。一种医疗领域问答对的生成方法,所述方法包括:获取问诊记录数据,问诊记录数据中包括多个问答句以及对应各问答句的对象的对象标识;基于各对象标识,对问诊记录数据中的各问答句分别进行意图识别,得到对应问诊记录数据的意图标识序列;根据多个问诊记录数据对应的意图标识序列,确定意图标识序列中各问句的问句意图标识所对应的多个初始答句的答句本文档来自技高网...

【技术保护点】
1.一种医疗领域问答对的生成方法,其特征在于,所述方法包括:/n获取问诊记录数据,所述问诊记录数据中包括多个问答句以及对应各问答句的对象的对象标识;/n基于各所述对象标识,对所述问诊记录数据中的各问答句分别进行意图识别,得到对应所述问诊记录数据的意图标识序列;/n根据多个问诊记录数据对应的意图标识序列,确定意图标识序列中各问句的问句意图标识所对应的多个初始答句的答句识别标识;/n从所述多个初始答句的答句识别标识中确定对应所述问句的目标答句意图标识,并基于各问句意图标识以及对应的目标答句意图标识,生成各目标问答对。/n

【技术特征摘要】
1.一种医疗领域问答对的生成方法,其特征在于,所述方法包括:
获取问诊记录数据,所述问诊记录数据中包括多个问答句以及对应各问答句的对象的对象标识;
基于各所述对象标识,对所述问诊记录数据中的各问答句分别进行意图识别,得到对应所述问诊记录数据的意图标识序列;
根据多个问诊记录数据对应的意图标识序列,确定意图标识序列中各问句的问句意图标识所对应的多个初始答句的答句识别标识;
从所述多个初始答句的答句识别标识中确定对应所述问句的目标答句意图标识,并基于各问句意图标识以及对应的目标答句意图标识,生成各目标问答对。


2.根据权利要求1所述的方法,其特征在于,所述基于各所述对象标识,对所述问诊记录数据中的各问答句分别进行意图识别,得到对应所述问诊记录数据的意图标识序列,包括:
根据各所述对象标识,确定所述问诊记录数据中对应各对象的各问答句;
对各对象的各问答句分别进行识别,确定各所述问答句为对应对象的问句或者对应对象的答句;
对各所述对象的问句或者各对象的答句分别进行意图识别,得到对应的意图标识;
根据所得到的所述意图标识,得到对应所述问诊记录数据的意图标识序列。


3.根据权利要求2所述的方法,其特征在于,所述对各对象的各问答句分别进行识别,确定各所述问答句为对应对象的问句或者对应对象的答句,包括:
识别各对象的各问答句中的关键字符,并基于识别的各关键字符确定各问答句为问句的概率指标;
判断所述概率指标是否大于或等于预设指标阈值;
当所述概率指标大于或等于所述预设指标阈值时,则确定所述问答句为问句;
当所述概率指标小于所述预设指标阈值时,则确定所述问答句为答句。


4.根据权利要求2所述的方法,其特征在于,所述对各所述对象的问句或者各对象的答句分别进行意图识别,得到各意图标识,包括:
通过预先训练完成的对应各所述对象的问句或者各对象的答句的意图识别模型分别进行意图识别,得到各意图标识;
所述意图识别模型的训练方式包括:
获取多个历史问诊记录数据;
基于各所述历史问诊记录数据中的角色标识,对各所述问诊记录数据中的各问答句进行识别并进行分类,得到分别对应各对象的问句以及各答句的分类结果,各分类结果中包括第一数量的问答句;
对所述分类结果中的问答句进行聚类,生成对应所述分类结果的各问答句聚类集合;
根据各所述分类结果的问答句聚类集合,对各意图识别模型进行分别训练,得到训练后的各意图识别模型。


5.根据权利要求4所述的方法,其特征在于,所述对所述分类结果中的问答句进行聚类,生成对应所述分类结果的各问答句聚类集合,包括:
对所述分类结果中的问答句进行分组,得到第二数量的问答句集合;
根据问答句的文本组成以及句子长度,确定各问答句集合中任意两个问答句的句子相似度,并基于确定的句子相似度生成对应所述分类结果的第三数量的相似...

【专利技术属性】
技术研发人员:赵旭
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1