基于自然语言处理和问答匹配的实验室管理系统技术方案

技术编号:31745056 阅读:14 留言:0更新日期:2022-01-05 16:24
本发明专利技术公开一种基于自然语言处理和问答匹配的实验室管理系统,涉及自然语言处理和语音识别领域,包括:语音识别模块,获取语音指令并转换为文字指令;语料库模块,存放语料数据,包括实验室数据、制药行业最新动态、终端设备的功能说明;指令处理模块,对文字指令进行向量化处理,提取特征向量;功能匹配模块,明确用户操作类型,计算特征向量与语料数据相似度,返回相似度最高的语料数据对应的答案;控制器模块,与上述模块相连,控制各个模块协同工作。本发明专利技术通过语音输入指令实现系统的查询功能与记录数据功能,减少了实验人员双手对系统的操作,提高了工作效率,解决了实验数据记录不及时不准确的问题。及时不准确的问题。

【技术实现步骤摘要】
基于自然语言处理和问答匹配的实验室管理系统


[0001]本专利技术涉及自然语言处理和语音识别领域,特别涉及一种基于自然语言处理和问答匹配的实验室管理系统。

技术介绍

[0002]实验室信息管理系统为实验室提供了信息化的管理模式,给实验室带来了极大地便利,对于实验室来说,不管是科研实验室还是检测检验实验室,都离不开庞大而复杂的数据记录体系,但是现有的实验室管理系统大多采用人工记录数据,存在数据记录不及时、不可控的人为因素造成的记录错误的数据安全问题,同时还会浪费不必要的人力。
[0003]自然语言处理是实现人与计算机之间用自然语言进行交流的理论和方法,语音识别技术是让机器识别和理解自然语言并把语音信号转换为文字的技术,随着自然语言处理方法的不断发展和日益成熟的语音识别技术,现有的许多终端设备都具备了语音识别功能,将自然语言处理和语音识别技术运用到实验室管理系统中,通过自然语言命令系统,进行查询数据和记录数据的操作,减少了实验人员双手对系统的操作,对于实验室提高工作效率、保证数据的原始性与准确性具有重要意义。

技术实现思路

[0004]本专利技术为了解决上述问题,提出了一种基于自然语言处理和问答匹配的实验室管理系统,通过语音输入向系统发出操作指令,查询数据和辅助实验人员在实验过程中记录数据,减少了实验人员双手对系统的操作,实现了实验操作和数据记录同步进行,且不用消耗不必要的人力资源,极大地提高了工作效率,节约了实验时间,同时避免了人工记录数据会产生的数据安全隐患问题。
[0005]为了实现上述目的,本专利技术提供技术方案如下:一种基于自然语言处理和问答匹配的实验室管理系统,包括:语音识别模块、语料库模块、指令处理模块,功能匹配模块,控制器模块。
[0006]进一步地,所述语音识别模块,用于获取语音指令并转换为文字指令,用户通过连接系统的终端设备的语音识别组件输入语音指令,并且由语音识别组件自动将识别到的语音指令转换为文字指令。
[0007]进一步地,所述终端设备包括但不限于手机、电脑、实验室仪器。
[0008]进一步地,所述语料库模块,用于存放语料数据,语料数据内容具体分为三部分,分别为实验室数据、制药行业最新动态、连接系统的终端设备的功能说明,三种数据经过收集、分析、整理组成初始语料数据,使用BERT模型进行向量化处理,生成对应的初始语料向量,共同组成语料库的语料数据。
[0009]进一步地,所述实验室数据,指实验室数据库中存储的实验记录报告或其他实验室相关数据。
[0010]进一步地,所述行业最新动态,指系统使用网络爬虫技术,定期在互联网上通过正
规途径选取的生物制药行业标准的种子URL。
[0011]进一步地,所述终端设备的功能说明,指实验室人员或技术人员根据连接系统的各种终端设备所具备的具体功能编写。
[0012]进一步地,所述语料库中语料数据的分类以初始语料向量的距离为标准进行分类,技术人员根据实验室的需求和实际情况选取第一分类中心向量,计算初始预料向量与第一分类中心向量的距离,规定一个阈值,将超过阈值的初始语料向量归为一类。
[0013]进一步地,距离计算方式采用余弦相似度。
[0014]进一步地,所述指令处理模块,用于对文字指令的处理,包括文字指令向量化和获取文字指令对应的特征向量。
[0015]进一步地,所述对文字指令的处理,将文字指令输入经过训练的BERT模型中,BERT模型将文字指令进行向量化处理,并输出文字指令对应的特征向量。
[0016]进一步地,所述功能匹配模块用于计算特征向量与语料数据的相似度,系统选择相似度最高的指令执行。
[0017]进一步地,首先计算特征向量与语料库第一分类中心向量的余弦相似度确定用户操作类型,再计算特征向量与对应类型下的语料数据的余弦相似度,对应不同的操作类型设置不同的问答匹配规则。
[0018]进一步地,用户操作类型包括查询数据和记录数据。
[0019]进一步地,所述控制器模块,用于控制上述各个模块协同工作,负责接收各个模块的消息和发布执行命令到各个模块,控制终端设备的显示屏显示最终结果。
[0020]与现有技术相比,本专利技术所提供的一种基于自然语言处理和问答匹配的实验室管理系统,实现了系统通过用户的语音输入进行数据查询和数据记录的功能,减少了用户双手对系统的操作,提高了工作效率,避免了由人工记录数据不及时不准确所产生的数据安全隐患,同时通过系统自动填入数据将使实验记录更加标准化,为实验人员管理和存储实验记录提供了极大地便利。
附图说明
[0021]下面结合附图对本专利技术做进一步的说明。
[0022]图1为基于自然语言处理和问答匹配的实验室管理系统的逻辑示意图。
[0023]图2为语料数据的组成示意图。
[0024]图3为语料库的结构示意图。
具体实施方式
[0025]为了实现本专利技术的最终目的,下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行完整、明确地描述。
[0026]本专利技术提出的一种基于自然语言处理和问答匹配的实验室管理系统,包括:语音识别模块、语料库模块、指令处理模块,功能匹配模块、控制器模块。
[0027]参照图1所示,基于自然语言处理和问答匹配的实验室管理系统,控制器模块与语音识别模块、语料库模块、指令处理模块、功能匹配模块相连,负责接收各个模块的消息和控制各个模块的工作运行,语料库中的数据包括制药行业最新动态、实验室数据、终端设备
的功能说明。
[0028]语音识别模块用于获取用户的语音指令并将语音指令转换为文字指令,在一个可选的实施例中,用户通过连接系统的终端设备的语音识别组件输入语音指令,当系统成功检测到用户的语音输入时,由语音识别组件将语音指令自动转换为文字指令,所述终端设备包括但不限于手机、电脑、实验室仪器。
[0029]语料库模块用于存放语料数据,是系统进行问答匹配的基础,语料库中的语料数据组成参照图2所示,包括制药行业最新动态、实验室数据、终端设备的功能说明。
[0030]在一个可选的实施例中,制药行业最新动态通过网络爬虫技术定期在互联网上通过正规渠道爬取,技术人员根据实际情况和实验室需求制定规则,选取生物制药行业标准的种子URL,并分析已抓取URL队列中的URL,获得实验室需要的数据,时间为6个月一次;实验室数据为实验室数据库中存储的实验记录报告或其他与实验室相关的数据;终端设备的功能说明由实验室人员或技术人员根据使用终端设备的用语习惯或公认的用语标准编写。
[0031]选用上述实施例,将三种数据经过收集、分析、整理后形成初始语料数据,通过BERT模型将初始语料数据进行向量化处理,生成对应的初始语料向量,共同组成语料库的语料数据,用于匹配用户的指令。
[0032]选用上述实施例,将三种数据进行分类存储,类型相似或者语义相近的初始语料数据对应的初始语料向量也拥有较近的距离,因此将初始语料向量之间的距离作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于自然语言处理和问答匹配的实验室管理系统,其特征在于,包括:语音识别模块,获取语音指令并转换为文字指令;语料库模块,存放语料数据,包括实验数据记录、制药行业最新动态、终端设备的功能说明;指令处理模块,对文字指令进行向量化处理,提取特征向量;功能匹配模块,明确用户操作类型,计算特征向量与语料数据相似度,返回相似度最高的语料数据对应的答案;控制器模块,与上述模块相连,控制各个模块协同工作。2.根据权利要求1所述的基于自然语言处理和问答匹配的实验室管理系统,其特征在于,所述语料库模块,用于收集、分析、整理初始语料数据,生成对应的初始语料向量,并根据初始语料向量之间的距离对其进行分类存储。3.根据权利要求2所述的基于自然语言处理和问答匹配的实验室管理系统,其特征在于,根据本发明提供的功能选取两个第一分类中...

【专利技术属性】
技术研发人员:贺敦伟
申请(专利权)人:则正上海生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1