基于人工智能的文本处理方法、装置、设备及存储介质制造方法及图纸

技术编号:39064451 阅读:11 留言:0更新日期:2023-10-12 19:57
本申请属于人工智能领域与数字医疗领域,涉及一种基于人工智能的文本处理方法,包括:获取任务描述文本;获取与任务描述文本对应的应用场景文本;从样本数据库获取与任务描述文本匹配的样本描述文本;基于语言类型对样本描述文本进行改写得到目标样本描述文本;基于目标任务数量生成任务要求文本;对任务描述文本、应用场景文本、目标样本描述文本以及任务要求文本进行组合得到组合文本;通过大型语言模型输出组合文本的目标文本数据。本申请还提供一种基于人工智能的文本处理装置、计算机设备及存储介质。此外,目标文本数据可存储于区块链中。本申请可应用于医疗领域的文本生场景,有效提高了基于生成的与组合文本对应的目标文本数据的准确度。标文本数据的准确度。标文本数据的准确度。

【技术实现步骤摘要】
基于人工智能的文本处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能开发
与数字医疗领域,尤其涉及基于人工智能的文本处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]在自然语言处理领域中,基于大规模数据训练的大型语言模型如GPT

3、GPT

4,它们具有强大的学习能力。但是,由于这些大型语言模型是基于大规模数据训练构建的,虽然可以适用于多种下游任务,但是对于特定领域下的文本处理任务的准确性往往不高。例如医疗领域下的患者问答的文本处理任务,通过大型语言模型对患者输入的任务描述文本进行直接处理,往往只会输出符合大主题却不完全符合细分主题的较为宽泛的问答文本数据,从而导致大型语言模型在处理一些细化的特定领域的任务时存在精确度较低的问题。

技术实现思路

[0003]本申请实施例的目的在于提出一种基于人工智能的文本处理方法、装置、计算机设备及存储介质,以解决现有的大型语言模型对输入的任务描述文本进行直接处理,往往只会输出符合大主题却不完全符合细分主题的较为宽泛的问答文本数据,从而导致大型语言模型在处理一些细化的特定领域的任务时存在精确度较低的问题的技术问题。
[0004]为了解决上述技术问题,本申请实施例提供一种基于人工智能的文本处理方法,采用了如下所述的技术方案:
[0005]获取待处理的任务描述文本;
[0006]获取与所述任务描述文本对应的应用场景文本;
[0007]从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本;
[0008]基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本;
[0009]获取预设的目标任务数量,并基于所述目标任务数量生成任务要求文本;
[0010]对所述任务描述文本、所述应用场景文本、所述目标样本描述文本以及所述任务要求文本进行组合处理,得到组合文本;
[0011]将所述组合文本输入至预设的大型语言模型内,通过所述大型语言模型输出与所述组合文本对应的目标文本数据。
[0012]进一步的,所述获取与所述任务描述文本对应的应用场景文本的步骤,具体包括:
[0013]对所述任务描述文本进行分词处理,得到第一词语集;
[0014]对所述第一词语集进行过滤处理,得到第二词语集;
[0015]基于预设的关键词提取算法对所述第二词语集进行关键词提取,得到目标关键词;
[0016]基于所述目标关键词对预设的领域词典进行查询处理,得到与所述目标关键词对应的目标领域;
[0017]获取与所述目标领域对应的领域描述文本;
[0018]将所述领域描述文本作为所述应用场景文本。
[0019]进一步的,所述从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本的步骤,具体包括:
[0020]将所述任务描述文本与所述样本数据库中包含的所有任务文本进行相似度计算,得到所述任务描述文本与各所述任务文本之间的相似度;
[0021]从所有所述相似度中筛选出数值最高的指定相似度,并获取与所述指定相似度对应的指定任务文本;
[0022]从所述样本数据库中获取与所述指定任务样本对应的指定样本描述文本;
[0023]将所述指定样本描述文本作为所述样本描述文本。
[0024]进一步的,所述基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本的步骤,具体包括:
[0025]获取所述样本描述文本中的初始描述语句;
[0026]基于所述语言类型对所述初始描述语句进行改写,得到与所述语言类型对应的目标初始描述语句;
[0027]基于所述目标初始描述语句对所述样本描述文本中的所述初始描述语句进行替换处理,得到替换后的样本描述文本;
[0028]将所述替换后的样本描述文本作为所述目标样本描述文本。
[0029]进一步的,所述获取预设的目标任务数量,并基于所述目标任务数量生成任务要求文本的步骤,具体包括:
[0030]获取预设的任务要求文本模板;
[0031]确定所述任务要求文本模板中的任务数量位置;
[0032]基于所述任务数量位置,在所述任务要求文本模板中对所述目标任务数量进行填充处理,得到填充后的任务要求文本模板;
[0033]将所述填充后的任务要求文本模板作为所述任务要求文本。
[0034]进一步的,所述对所述任务描述文本、所述应用场景文本、所述目标样本描述文本以及所述任务要求文本进行组合处理,得到组合文本的步骤,具体包括:
[0035]获取预设的组合模板;
[0036]基于所述组合模板对所述任务描述文本、所述应用场景文本、所述目标样本描述文本以及所述任务要求文本进行组合处理,得到组合后的组合模板;
[0037]将所述处理后的组合模板作为所述组合文本。
[0038]进一步的,所述获取待处理的任务描述文本的步骤,具体包括:
[0039]获取用户输入的初始任务描述文本;
[0040]判断在所述初始任务描述文本中是否存在违规词;
[0041]若不存在违规词,判断所述初始任务描述文本是否符合预设的任务描述规范;
[0042]若符合所述任务描述规范,则将所述初始任务描述文本作为所述任务描述文本。
[0043]为了解决上述技术问题,本申请实施例还提供一种基于人工智能的文本处理装置,采用了如下所述的技术方案:
[0044]第一获取模块,用于获取待处理的任务描述文本;
[0045]第二获取模块,用于获取与所述任务描述文本对应的应用场景文本;
[0046]第三获取模块,用于从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本;
[0047]第一处理模块,用于基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本;
[0048]生成模块,用于获取预设的目标任务数量,并基于所述目标任务数量生成任务要求文本;
[0049]第二处理模块,用于对所述任务描述文本、所述应用场景文本、所述目标样本描述文本以及所述任务要求文本进行组合处理,得到组合文本;
[0050]输出模块,用于将所述组合文本输入至预设的大型语言模型内,通过所述大型语言模型输出与所述组合文本对应的目标文本数据。
[0051]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0052]获取待处理的任务描述文本;
[0053]获取与所述任务描述文本对应的应用场景文本;
[0054]从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本;
[0055]基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本;
[0056]获取预设的目标任务数量,并基于所述目标任务数量生成任务要求文本;
[0057]对所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的文本处理方法,其特征在于,包括下述步骤:获取待处理的任务描述文本;获取与所述任务描述文本对应的应用场景文本;从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本;基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本;获取预设的目标任务数量,并基于所述目标任务数量生成任务要求文本;对所述任务描述文本、所述应用场景文本、所述目标样本描述文本以及所述任务要求文本进行组合处理,得到组合文本;将所述组合文本输入至预设的大型语言模型内,通过所述大型语言模型输出与所述组合文本对应的目标文本数据。2.根据权利要求1所述的基于人工智能的文本处理方法,其特征在于,所述获取与所述任务描述文本对应的应用场景文本的步骤,具体包括:对所述任务描述文本进行分词处理,得到第一词语集;对所述第一词语集进行过滤处理,得到第二词语集;基于预设的关键词提取算法对所述第二词语集进行关键词提取,得到目标关键词;基于所述目标关键词对预设的领域词典进行查询处理,得到与所述目标关键词对应的目标领域;获取与所述目标领域对应的领域描述文本;将所述领域描述文本作为所述应用场景文本。3.根据权利要求1所述的基于人工智能的文本处理方法,其特征在于,所述从预设的样本数据库中获取与所述任务描述文本匹配的样本描述文本的步骤,具体包括:将所述任务描述文本与所述样本数据库中包含的所有任务文本进行相似度计算,得到所述任务描述文本与各所述任务文本之间的相似度;从所有所述相似度中筛选出数值最高的指定相似度,并获取与所述指定相似度对应的指定任务文本;从所述样本数据库中获取与所述指定任务样本对应的指定样本描述文本;将所述指定样本描述文本作为所述样本描述文本。4.根据权利要求1所述的基于人工智能的文本处理方法,其特征在于,所述基于预设的语言类型对所述样本描述文本进行改写,得到对应的目标样本描述文本的步骤,具体包括:获取所述样本描述文本中的初始描述语句;基于所述语言类型对所述初始描述语句进行改写,得到与所述语言类型对应的目标初始描述语句;基于所述目标初始描述语句对所述样本描述文本中的所述初始描述语句进行替换处理,得到替换后的样本描述文本;将所述替换后的样本描述文本作为所述目标样本描述文本。5.根据权利要求1所述的基于人工智能的文本处理方法,其特征在于,所述获取预设的目标任务数量,并基于所述目标任务数量生...

【专利技术属性】
技术研发人员:陈思玥周晓峰李松岭王科强倪渊
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1