数据处理方法、装置以及计算机程序产品制造方法及图纸

技术编号:44598230 阅读:16 留言:0更新日期:2025-03-14 12:54
本公开是关于一种数据处理方法、装置以及计算机程序产品。该方法包括:获取文本单元,对所述文本单元进行向量转换,得到所述文本单元的文本向量;基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库;根据所述目标数据库,构建目标语料库。能够丰富目标语料库中的数据量,增加目标语料库中数据的全面性,在对目标语料库进行数据查询时,能够提高查询结果的准确性。

【技术实现步骤摘要】

本公开涉及但不局限于信息,尤其涉及一种数据处理方法、装置以及计算机程序产品


技术介绍

1、数据查询是指基于用户输入的查询语句,对数据库中的数据进行查询和分析,进而得到查询结果。例如,可以基于查询语句从预先构建的知识库中查询答案,并将查询得到的答案反馈给用户。

2、但是,相关技术中预先构建的知识库中的数据比较单一,且不全面,导致查询得到的结果不准确。


技术实现思路

1、为克服相关技术中存在的问题,本公开提供一种数据处理方法、装置以及计算机程序产品,能够丰富目标语料库中的数据量,增加目标语料库中数据的全面性,在对目标语料库进行数据查询时,能够提高查询结果的准确性。

2、根据本公开实施例的第一方面,提供一种数据处理方法,包括:

3、获取文本单元,对所述文本单元进行向量转换,得到所述文本单元的文本向量;

4、基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库;

5、根据所述目标数据库,构建目标语料库。

6、根据本公开实施例本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述文本单元的标识和所述关联关系集,构建关系数据库,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一查询语句、所述第一查询结果以及所述参考结果,确定所述目标语料库的目标评估值,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述文本单元的标识和所述关联关系集,构建关系数据库,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一查询语句、所述第一查询结果以及所述参考结果,确定所述目标语料库的目标评估值,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述第一查询结果中第一目标结果的数量和所述第一查询结果的数量...

【专利技术属性】
技术研发人员:王忠新王衡阳李阳罗雄清徐奕成刘长波
申请(专利权)人:珠海金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1