【技术实现步骤摘要】
一种用于人工智能算法的器官芯片数据库向量化方案
[0001]本专利技术属于生物医学工程和计算机科学医工融合领域,设计了一种适用于器官芯片数据库向量化的方法。器官芯片数据库中包含着生物支架材料、试剂、细胞系、药物、器官芯片型号、器官芯片配置参数(试剂和药物浓度、细胞类型等),以及作为标签数据的时间信息和实验结果(细胞代谢物浓度、细胞的数量和存活率、芯片内微环境的PH、温度、氧气浓度、二氧化碳浓度、TEER、气压、是否加入药物、药物的释放速度、降解速率),经过这些数据的训练可以得到深度学习模型权重矩阵,当输入如上的这些信息后模型会自动预测出标签数据。而对于数据库中的数据要输入到模型之中首先要做的就是数据的格式转换,因为器官芯片数据库中存储的数据类型和格式不统一,有文本信息和数字信息,甚至图像信息,这些信息需要转换为机器学习算法所能识别的向量信息。本专利正是为了解决此问题而设计——如何将器官芯片的数据向量化。
技术介绍
[0002]器官芯片指的是一种在芯片上构建的器官生理微系统,它以微流控芯片为核心,通过与细胞生物学、生物材料和工 ...
【技术保护点】
【技术特征摘要】
1.一种用于人工智能算法的器官芯片数据库向量化方案,其特征在于:器官芯片数据库中的数据信息进行向量转换,需要把实际数据(文本的和非文本的信息,诸如生物支架材料和药物试剂的名称、分子式、成份等)转换成深度学习模型可以理解和计算的数字信息,而这些数字信息就是一种编码表示,且为数字格式的编码表示,便于人工智能模型计算。2.根据权利要求1所述的一种用于人工智能算法的器官芯片数据库向量化方案,其特征在于,所述权利1中的数据信息主要包括:药物信息相关的数据表、细胞信息相关的数据表、生物支架材料信息相关的数据表、生物试剂信息相关的数据表、器官芯片型号相关的数据表、器官芯片参数配置数据表和带有时间信息的实验结果数据表。3.根据权利要求2所述的一种用于人工智能算法的器官芯片数据库向量化方案,其特征在于,所述关于药物信息相关的数据表的向量化,药物分子式可以使用摩根算法转为指纹信息,由于指纹信息数字位数过长,所以可以再经过某种模型进行二次训练转换,比如可以经过BERT算法再输出向量,或者药物分子式也可以经过Mol2Vec算法直接转换为向量,转换后的数字字符串结果可以直接存储在药物信息表中。对于靶蛋白质氨基酸序列的向量化,可以把氨基酸序列用PSSM方法表示,其余信息,如果是数字可以使用0到1之间的归一化方法编码,如果是文本可以使用One
‑
hot编码。4.根据权利要求2所述的一种用于人工智能算法的器官芯片数据库向量化方案,其特征在于,所述关于细胞信息相关的数据表的向量化,细胞基因序列可以用GENE2VEC方法进行向量化,并存入细胞信息数据表。其余信息,如果是数字可以使用0到1之间的归一化方法编码,如果是文本可以使用One
‑
hot编码。5.根据权利要求2所述的一种用于人工智能算法的器官芯片数据库向量化方案,其特征在于,所述关于生物支架材料信息相关的数据表的向量化,分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。