一种词库生成方法、装置、设备及介质制造方法及图纸

技术编号:44141571 阅读:25 留言:0更新日期:2025-01-29 10:18
本发明专利技术公开了一种词库生成方法、装置、设备及介质。该方法包括:获取至少一个领域类型及各领域类型对应的输入文本;领域类型对应的输入文本为在用户使用领域类型对应的工作设备的工作过程中工作设备接收的文本;根据各领域类型对应的输入文本,确定通用领域文本;根据各领域类型的输入文本和通用领域文本,确定各领域类型的定制词库。本发明专利技术实施例可以提高词库生成的准确率。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种词库生成方法、装置、设备及介质


技术介绍

1、随着科技的快速发展,大语言模型的发展逐渐壮大,应用在人们生活的方方面面。大语言模型可预设词库内容,通过利用词库中的词汇进行知识问答操作。

2、当前,大语言模型中词库的内容是通过数据训练或人工编撰得到的,但是该方法的准确率较低。


技术实现思路

1、本专利技术提供了一种词库生成方法、装置、设备及介质,以提高词库生成的准确性。

2、第一方面,本专利技术实施例提供了一种词库生成方法,该方法包括:

3、获取至少一个领域类型及各领域类型对应的输入文本;领域类型对应的输入文本为在用户使用领域类型对应的工作设备的工作过程中工作设备接收的文本;

4、根据各领域类型对应的输入文本,确定通用领域文本;

5、根据各领域类型的输入文本和通用领域文本,确定各领域类型的定制词库。

6、第二方面,本专利技术实施例还提供了一种词库生成装置,该装置包括:

7、数据获取模块,用于获本文档来自技高网...

【技术保护点】

1.一种词库生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各所述领域类型的输入文本和所述通用领域文本,确定各所述领域类型的定制词库,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取至少一个领域类型及各所述领域类型对应的输入文本,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取至少一个领域类型及各所述领域类型对应的输入文本,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述领域类型对应的输入文本的出现次数和所述输入文本的拼音字符串,判断所述输入文本是否为异常文本,包括:...

【技术特征摘要】

1.一种词库生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各所述领域类型的输入文本和所述通用领域文本,确定各所述领域类型的定制词库,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取至少一个领域类型及各所述领域类型对应的输入文本,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取至少一个领域类型及各所述领域类型对应的输入文本,包括:

5.根据...

【专利技术属性】
技术研发人员:涂闪
申请(专利权)人:太平金融科技服务上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1