System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 同义词搜寻系统及方法技术方案_技高网

同义词搜寻系统及方法技术方案

技术编号:41365658 阅读:35 留言:0更新日期:2024-05-20 10:13
本发明专利技术提出一种同义词搜寻方法,其包含以下步骤:当接收由使用者装置传来的词汇与词汇的定义时,透过自然语言处理模型以根据词汇的定义从资料治理辞典搜寻词汇的同义词;在提供同义词给使用者装置以后,接收由使用者装置传来的关于同义词的回馈资讯,将回馈资讯做为词汇的标记以回馈给自然语言处理模型。

【技术实现步骤摘要】

本专利技术涉及一种搜寻系统及方法,且特别是有关于一种同义词搜寻系统及其同义词搜寻方法。


技术介绍

1、目前资料治理定义同义词时,使用者须先自行使用中英文名称查询是否有可能同义的词汇,并将中英文名称改成与同义词的中英文名称相同,若名称不改成相同则需特别写上指定同义词,才可将两词汇连结成同义词,同时在资料治理的流程中,使用者也需根据同义词的主被动状况决定此词汇的型态,此方法可能造成以下缺点:1.人工查询耗时耗力;2.可能有打字输入等人为错误因素导致找不到同义词;3.原本中英名称不同,由于是同义字被迫改成同名称;4.只透过中英名称搜寻,人工很可能遗漏,不知道此词汇其实有同义词;5.自行设定词汇型态容易出错,造成重复型态出现或是遗漏。


技术实现思路

1、本专利技术提出一种同义词搜寻系统及同义词搜寻方法,改善先前技术的问题。

2、在本专利技术的一些实施例中,本专利技术所提出的同义词搜寻系统包含传输装置、储存装置以及处理器。储存装置储存资料治理辞典与自然语言处理模型,处理器电性连接储存装置与传输装置。当传输装置接收由使用者装置传来的词汇与词汇的定义时,处理器透过自然语言处理模型以根据词汇的定义从资料治理辞典搜寻词汇的同义词,在传输装置提供同义词给使用者装置以后,传输装置接收由使用者装置传来的关于同义词的回馈资讯,处理器将回馈资讯做为词汇的标记以回馈给自然语言处理模型。

3、在本专利技术的一些实施例中,处理器将词汇、词汇的定义及回馈资讯的相关资料储存至储存装置以更新资料治理辞典。

4、在本专利技术的一些实施例中,处理器基于使用者上传资料以调整自然语言处理模型。

5、在本专利技术的一些实施例中,处理器基于使用者上传资料以修改自然语言处理模型中的输出层,并微调输出层前的复数层的参数。

6、在本专利技术的一些实施例中,自然语言处理模型包含预训练的双向语言模型、预训练的单向语言模型与预训练的神经网路模型中的至少一个。

7、在本专利技术的一些实施例中,本专利技术所提出的同义词搜寻方法包含以下步骤:当接收由使用者装置传来的词汇与词汇的定义时,透过自然语言处理模型以根据词汇的定义从资料治理辞典搜寻词汇的同义词;在提供同义词给使用者装置以后,接收由使用者装置传来的关于同义词的回馈资讯,依据词汇、词汇的定义及回馈资讯的相关资料以更新资料治理辞典。

8、在本专利技术的一些实施例中,同义词搜寻方法更包含:将回馈资讯做为词汇的标记以回馈给自然语言处理模型。

9、在本专利技术的一些实施例中,同义词搜寻方法更包含:若回馈资讯为同意同义词,将词汇、词汇的定义及同义词的相关资料储存至资料治理辞典。

10、在本专利技术的一些实施例中,基于使用者上传资料以微调自然语言处理模型的步骤包含:基于使用者上传资料以修改自然语言处理模型中的输出层,并微调输出层前的复数层的参数。

11、在本专利技术的一些实施例中,自然语言处理模型包含预训练的双向语言模型、预训练的单向语言模型与预训练的神经网路模型中的至少一个。

12、综上所述,本专利技术的技术方案与现有技术相比具有明显的优点和有益效果。藉由本专利技术的同义词搜寻系统及同义词搜寻方法,解决了先前技术的缺点,从而降低错误发生可能性与提升时间与人力的效率。

13、以下将以实施方式对上述的说明作详细的描述,并对本专利技术的技术方案提供更进一步的解释。

本文档来自技高网...

【技术保护点】

1.一种同义词搜寻系统,其特征在于,包含:

2.如权利要求1所述的同义词搜寻系统,其特征在于,其中所述处理器将所述词汇、所述词汇的所述定义及所述回馈资讯的相关资料储存至所述储存装置以更新所述资料治理辞典。

3.如权利要求1所述的同义词搜寻系统,其特征在于,其中所述处理器基于一使用者上传资料以调整所述自然语言处理模型。

4.如权利要求3所述的同义词搜寻系统,其特征在于,其中所述处理器基于所述使用者上传资料以修改所述自然语言处理模型中的一输出层,并微调所述输出层前的复数层的参数。

5.如权利要求1所述的同义词搜寻系统,其特征在于,其中所述自然语言处理模型包含一预训练的双向语言模型、一预训练的单向语言模型与一预训练的神经网路模型中的至少一者。

6.一种同义词搜寻方法,其特征在于,包含以下步骤:

7.如权利要求6所述的同义词搜寻方法,其特征在于,更包含:

8.如权利要求6所述的同义词搜寻方法,其特征在于,更包含:

9.如权利要求6所述的同义词搜寻方法,其特征在于,更包含:

10.如权利要求6所述的同义词搜寻方法,其特征在于,其中所述自然语言处理模型包含一预训练的双向语言模型、一预训练的单向语言模型与一预训练的神经网路模型中的至少一个。

...

【技术特征摘要】

1.一种同义词搜寻系统,其特征在于,包含:

2.如权利要求1所述的同义词搜寻系统,其特征在于,其中所述处理器将所述词汇、所述词汇的所述定义及所述回馈资讯的相关资料储存至所述储存装置以更新所述资料治理辞典。

3.如权利要求1所述的同义词搜寻系统,其特征在于,其中所述处理器基于一使用者上传资料以调整所述自然语言处理模型。

4.如权利要求3所述的同义词搜寻系统,其特征在于,其中所述处理器基于所述使用者上传资料以修改所述自然语言处理模型中的一输出层,并微调所述输出层前的复数层的参数。

5.如权利要求1所述的同义词搜寻系统,其特征在...

【专利技术属性】
技术研发人员:陈维超黄侲艗张毓伦吴卓叡魏智斌
申请(专利权)人:英业达科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1